2008-09-15 2 views

ответ

4

WordNet - это классический ресурс данных для английского языка с семантическими отношениями.

0

MontyLingua может пригодиться для промежуточного слоя между английским и корейским.

0

Natural Language Toolkit (NLTK) - отличный ресурс, если вы рассматриваете Python как язык. Он включает в себя множество вещей, которые вы ожидаете в среде обработки текста/NLP, таких как парсеры, стеблемеры и теги с частичной речью. Документация по этому тоже неплохая.

Что касается наборов данных, NLTK поставляется с множеством annotated corpora and textual data sets для экспериментов.

Надеюсь, это поможет, B.

Смежные вопросы