Я использую OpenNLP для обработки запросов, таких как «врач, работающий в Лос-Анджелесе» и «женщина, живущая в Голливуде и работающая в Санта-Монике». Для английского понимания человека эти предложения очень очевидны, что предметами являются «врач» и «женщина». Однако, когда я использую OpenNLP это помечено предложение, какOpenNLP, приводящий к нежелательному результату
female_JJ living_NN in_IN hollywood_NN
[женский живой] [в] [голливудского]
Вот другое предложение «человек, живущий в Санта-Монике и работает в Малибу и играть в футбол» был обработан должно быть
person_NN living_VBG in_IN santa_NN monica_NN and_CC working_VBG in_IN malibu_NN and_CC playing_NN football_NN
[ person ] [ living ] [ in ] [ santa monica ] and [ working ] [ in ] [ malibu and playing football ]
Почему маркер POS-терминалов OpenNLP помечен неверно? Эти предложения имеют простейшие грамматические структуры. Если самые продвинутые технологии НЛП все еще не могут проанализировать эти предложения, значит ли это, что НЛП далеко не практична?
Интересный пример. Какую версию OpenNLP вы используете для этого и какие файлы моделей? Укажите точные ссылки в виде URL-адресов или тегов версий. – MWiesner
Я использовал новейшую версию и модель en-pos-maxent. Кажется, у Стэнфорда Парсера и NLTK есть те же проблемы – Yangrui
, поэтому версия 1.6.0, правильно? – MWiesner