Я программирования бота в Java с HtmlUnit, который получает данные (название и цену) с двух разных сайтов электронной коммерции, A и B.Сравнение двух элементов на основе их имен
После того, как я собрал все предметы в файле csv (name; price), я пытаюсь сравнить их , чтобы узнать, какие товары одинаковы.
Редко имя элемента A равно имени элемента B, но часто они имеют некоторые сходства, такие как название модели или название бренда.
У кого-то есть идея или есть механизм для сравнения этих предметов и знать, являются ли они одним и тем же предметом?
Edit:
По крайней мере, есть 82000 Itema и 2000 itemB, и мне нужен инъективная функция, которая присваивает его.
itemA состоит из: фирменного наименования и названия моделей. (Структура -> Хорошо).
itemB состоит из: Описательный текст с фирменным наименованием и названием модели внутри, без какой-либо структуры.
Редко ItemA.name.equals (ItemB.name), но у них есть общие регионы (например, номер модели или название бренда). Я разделил элемент B в словах и использовал функцию .equals() для сравнения каждого слова с A.modelName, но во многих случаях он терпит неудачу. –
@ ismael-gandarillas Не могли бы вы разместить свой код, это предоставит мне лучшее представление о вашей проблеме, что приведет к лучшему решению. –