У меня есть две таблицы, каждая из которых предоставляет информацию о связке приложений, работающих в моей работе. Они были созданы двумя отдельными людьми, которые никогда, казалось, не соответствовали друг другу.Levenshtein Алгоритм сравнения расстояний/строк для фраз
В результате имена, которые они предоставили приложениям, не являются постоянными между листами. Они, однако, схожи. Например, можно было бы назвать приложение «Office 2010», другое «MS Office 10» или что-то еще.
Я искал алгоритм Левенштейна, но это, похоже, применимо только к отдельным словам или фразам, где порядок слов постоянный, и только орфография отличается. (Я не компьютерный ученый, не стесняйтесь меня поправить).
Поэтому я ищу алгоритм, который для каждого имени на одном листе может перебирать все имена на другом листе и находить ближайшее совпадение. Не обязательно быть совершенным, что-то поможет.
Любые идеи? Спасибо всем, кто может помочь.