Я пытаюсь сравнить текст с заранее составленным списком слов, в частности, производителей автомобилей. Проблема в том, что текст, который я сравниваю, написан людьми и не всегда надежный.Частичное соответствие строк с Python
Например, я хочу найти «Harley Davidson», но в тексте на самом деле говорится «Hardley Davidson» или какая-то другая неосторожная опечатка.
Я не думаю, что могу использовать регулярное выражение для решения этой проблемы ... или я могу? Есть ли частичная функция сопоставления строк? Возможно, я мог бы определить процент строки, которая должна соответствовать.
Попробуйте fuzzy wuzzy – The6thSense
http://streamhacker.com/2011/10/31/fuzzy-st ring-matching-python/вы должны найти nltk полезным –
Это похоже на хороший вариант. Не видел этого раньше. Попытка сейчас. –