2012-06-18 4 views
0

Я хотел бы создать алгоритм автоматического поиска синонимов (в основном для фирменных наименований). Например, если пользователь вводит слово «Coca cola», я хотел бы вернуть слово «Coke».алгоритм поиска текстового алгоритма синонима

Это легко сделать с помощью дикторов; но для этого мне нужен файл для справки. Как я могу автоматически создать его? (У меня есть небольшой корпус с 1 миллионом + записями, синонимы исходят из этого).

Есть ли алгоритмы интеллектуального анализа текста для решения этих проблем? Кроме того, есть некоторые интернет-синонима услуги, но они не содержат названия брендов :-(

Спасибо, krisy

+0

Что Ваши записи выглядят так? Можете ли вы скопировать свои записи, чтобы найти похожие термины? –

ответ

0

Trie алгоритм, основанный может найти синонимы или подобные слова. Это не с помощью клавиш, но положение в дереве для определения ключа. Например, из A вы переходите к B, а из B - к C. Существует множество структур данных для trie. Самый простой - это список смежных или тройное дерево поиска.

+0

Как вы предлагаете найти «Кокс» для «Кока-колы» будет работать с попытками? Связи будут приветствовать для simila ry слова/слова с ошибками, но я не вижу, как их можно использовать для синонимов :-( – krisy

+0

Показывать первые совпадающие деревья под буквой C? – Bytemain

+0

Я боюсь, что вернется слишком много слов :-( – krisy

Смежные вопросы