Я использую WordNet, доступ через NLTK Python для сравнения synsets слов из социальных сетей. Многие из этих слов не входят в версию WordNet, к которой подключается NLTK.Добавить слова в локальную копию WordNet
Когда я говорю I слова Я имею в виду термины, относящиеся к домену, а не аббревиатуры или смайлики.
Я составил список этих слов и хотел бы объединить этот список с WordNet.
В поисках попыток предпринимать попытки поиска методов автоматического обновления WordNet.
шаги я представляю себе являются:
- Клонирование WordNet дб
- Написать расширение модуля WordNet, который выглядит для локальной копии
- Update, что локальная копия.
Насколько разумно это звучит?
Какие «функции» вам нужны из wordnet? вам нужны только гипернимки или гипонимы или идентификаторы? – alvas
Я хочу рассчитать сходство пути, и поэтому мне нужны гипернимки и гипонимы. – mac389
Просмотр http://nltk.googlecode.com/svn-/trunk/doc/api/nltk.corpus.reader.wordnet-pysrc.html#WordNetCorpusReader. Сначала узнайте, где сохранен ваш каталог nltk_data, 'nltk.corpus.wordnet.root'. Затем перейдите в каталог и посмотрите, как выглядят структуры файлов, и добавьте новые синтезаторы в структуру. Это выглядит довольно сложно: = ( – alvas