У нас есть база данных, заполненная данными OCRed и введенными вручную данными.Полный текстовый поиск SQL Server с орфографическими ошибками в контенте
При выполнении поиска командой CONTAINS отображаются не все результаты. Таким образом, поиск «mankey monkey» не возвращает записи, в которых есть m0nkey man, mankey man в данных.
Есть ли способ разрешить эти проблемы в данных?
У меня был беглый взгляд на Lucene.NET и Soundex, но они не видят, что они очень полезны.
Спасибо за любые идеи
Я не уверен, если вы найдете бесплатные стеклотару, чтобы сделать это. Моя компания использовала Informatica с качеством данных, обладающим этой возможностью, этот инструмент используется для очистки данных, поэтому позже вы можете запросить и не беспокоиться о недостающих словах с ошибками. –