2015-08-24 2 views
0

Я использую OpenNLP для обработки запросов, таких как «врач, работающий в Лос-Анджелесе» и «женщина, живущая в Голливуде и работающая в Санта-Монике». Для английского понимания человека эти предложения очень очевидны, что предметами являются «врач» и «женщина». Однако, когда я использую OpenNLP это помечено предложение, какOpenNLP, приводящий к нежелательному результату

female_JJ living_NN in_IN hollywood_NN 

[женский живой] [в] [голливудского]

Вот другое предложение «человек, живущий в Санта-Монике и работает в Малибу и играть в футбол» был обработан должно быть

person_NN living_VBG in_IN santa_NN monica_NN and_CC working_VBG in_IN malibu_NN and_CC playing_NN football_NN 
[ person ] [ living ] [ in ] [ santa monica ] and [ working ] [ in ] [ malibu and playing football ] 

Почему маркер POS-терминалов OpenNLP помечен неверно? Эти предложения имеют простейшие грамматические структуры. Если самые продвинутые технологии НЛП все еще не могут проанализировать эти предложения, значит ли это, что НЛП далеко не практична?

+0

Интересный пример. Какую версию OpenNLP вы используете для этого и какие файлы моделей? Укажите точные ссылки в виде URL-адресов или тегов версий. – MWiesner

+0

Я использовал новейшую версию и модель en-pos-maxent. Кажется, у Стэнфорда Парсера и NLTK есть те же проблемы – Yangrui

+0

, поэтому версия 1.6.0, правильно? – MWiesner

ответ

0

точность всех этих проектов НЛП не может быть 100%. потому что эти проекты работают над случаями вероятности. эти ошибки могут быть там. тем не менее, это наиболее точные результаты работы

Смежные вопросы