Я пытаюсь создать поисковую систему, которая проходит через онлайн-объявления, такие как Oodle, eBay motors и craigslist. У меня также есть большая база данных стандартных названий транспортных средств и их спецификаций. Я хотел бы сделать это для каждой записи, которую я нахожу через классифицированный сайт, иметь возможность точно определить, какая модель автомобиля, стиль (из моей базы данных). Например, стандартное название для грузовика грузовика в моем дне: 2003 Ford F150.Каков наилучший метод интеллектуального анализа данных для поиска автомобиля?
Однако на сайтах, которые могут упоминаться люди, упоминается следующее: «2003 Ford F 150» или «2003 Ford f-150» или «03 Ford truck 150». Есть ли эффективный алгоритм интеллектуального анализа данных/текстовой классификации, чтобы иметь возможность нормализовать эти тексты до стандартного имени выше?