Я ищу библиотеку/класс, который позволяет удобно сравнивать две строки. В лучшем случае это даст в результате процент того, как две строки одинаковы. Я сравниваю названия компаний, адреса, которые записываются в разные хранилища, таким образом, имея много ошибок или несоответствий в именах.Смарт-сравнение строк
Примеры строк для сравнения:
"Good Company Ltd." vs. "GoodCompany"
"Baker Street 2" vs. "Baker Str. 2"
Если я получаю результат в процентах alikeness, чем это может быть вход для смарт слияния таких данных.
Знаете ли вы хорошие библиотеки, которые позволили бы сравнить такие умные строки?
Попробуйте взглянуть на это: http://stackoverflow.com/questions/2344320/comparing-strings-with-tolerance – Justin
Не могли бы вы рассказать нам, какой процент вы ожидаете получить за каждое из этих двух строк сравнения ? – jszigeti
Будет ли «ВеликоеОграничение» 'иметь какую-либо« алчность »для« GoodCompany »? Вы пытаетесь сравнить смысл? Как одинаково «принимать» и «кроме», которые похожи, но имеют разные значения? Что относительно '' country fair ''и' 'равно и справедливо'' или '' четыре свечи ''и' 'fork handles" '? Есть ли элемент НЛП или это более простой алгоритм? Вы хотите «Значки одинаковые», «Звучит одинаково» или «Выглядит одинаково»? – Jodrell