2010-10-17 16 views
2

Я хочу раскрасить слова в тексте в соответствии с их классификацией (категория/склонение и т. Д.). У меня есть полностью рабочий словарь, но проблема в том, что существует много двусмысленности. Например, foedere могут быть формами глагола «блуд» или существительным «договор».Анализ и анализ синтаксиса Word

Какие общие стратегии для решения этих двусмысленностей или создания хороших догадок?

Спасибо!

+0

Полноценное средство проверки орфографии/грамматики - это очевидное решение, и поскольку все еще не все в порядке (но все ближе), я сомневаюсь, что для вас есть одноразовое решение. Вы можете проверить скрипты с открытым исходным кодом для своих стратегий. – Wrikken

ответ

3

Общая стратегия заключается в первом запуске part-of-speech tagger данных для определения категории слов (существительное, глагол и т. Д.). Это, однако, требует данных (контекстная статистика) и инструментов. This research paper может быть отправной точкой.

Смежные вопросы