2010-12-28 2 views
0

Мы разрабатываем мобильное приложение, которое считывает штрих-коды продуктов и получает цены с 8 сайтов электронной коммерции. Я разрабатываю веб-сервер на C#, который имеет всю логику и отправляет данные клиенту с помощью веб-службы.Word Match Algorithm

Если я спрошу цену продукта, отправив штрих-код, все будет в порядке. Но большинство систем веб-сайтов не имеют номеров штрих-кода в своей базе данных, поэтому я должен отправить им имя продукта, и оно ДОЛЖНО соответствовать каким-либо образом, чтобы вернуть детали продукта.

Чтобы получить название продукта, я просматриваю UPC и получаю имя продукта с веб-сайта.

Но проблема начинается в этот момент. Каждый сайт электронной коммерции может иметь другую структуру и другое название продукта. Как я напишу алгоритм, который пойдет и проанализирует базы данных электронной коммерции и принесет мне результаты. Действительно ли я должен написать отдельный синтаксический анализатор данных для каждого сайта электронной коммерции. Есть ли алгоритм, который я могу написать.

Любая помощь будет оценена по достоинству.

ответ

0

Я узнал, что если я отправлю каждое слово в имени продукта в массиве строк, веб-сайт электронной торговли может искать в своей базе данных слово за словом, пока они не получат один результат продукта и не вернут его мне.

0

1-Одно решение будет хранить общее имя продукта в таблице базы данных, чтобы вы могли хранить их в памяти сервера как статический список и обновлять список по заданию в EOD.

2- Найти внешний веб-сервис, который предоставляет имя prodcut и использовать этот сервис в веб-службе.

потому что вы просто не можете пройти каждый веб-сайт для анализа данных.

+0

Второй выбор невозможно, как я уже сказал. Различные сайты электронной коммерции имеют разные имена в своих базах данных. Первый выбор как-то мануэла и не будет оптимизировать мое решение. Спасибо, хотя за ваш хороший ответ. –

1

Боюсь, вам придется написать этот парсер. Я сомневаюсь, что есть какой-нибудь алгоритм, который вы могли бы использовать, помимо того, как этот алгоритм должен работать ... (возможно, как ваш парсер)