2014-11-05 4 views
-1

Предположим, что это предложение: «Автомобиль не запускается в холодную погоду и должен менять лезвия ветрового стекла». Мне интересно узнать, какая часть автомобиля затронута, и в чем причина этого. Из приведенного выше предложения мы не можем сделать вывод, что лезвия ветрового стекла не начинаются. Кроме того, одно предложение может содержать несколько частей автомобиля. Как решить эту проблему?Как сделать семантический анализ из тега POS?

+0

Вы заинтересованы в «текстовом вступлении». посмотрите здесь: http://www.google.com/cse?cx=011664571474657673452%3A4w9swzkcxiy&cof=FORID%3A0&q=textual+entailment#gsc.tab=0&gsc.q=textual%20entailment&gsc.page=1 – Pierre

+0

расскажите нам о ваши данные, объем вашей системы и то, что было опробовано – Pierre

ответ

0

Я нашел решение, выше проблемы можно легко решить с помощью зависимостей Стэнфорда, поэтому мы можем использовать для этого стенографию Stanford coreNLP.

-1

Вы собираетесь сосредоточиться только на одной теме (например, на автомобилях)?

Если да, то для очень грубой отправной точки, вы могли бы иметь словарь части автомобиля и несколько высокочастотного п-грамма, такие как «нужно изменить», «ремонт, необходимый» и т.д.

POS части автомобиля всегда будет существительным. N-граммы, которые означают какое-то необходимое действие, будут иметь глагол как его значение POS.

Когда вы обнаруживаете один из n-граммов, который означает проблему или запрашивает действие, вы можете запросить список автозапчастей, чтобы увидеть, какие из них являются ответственными или затронуты.

Помните, что я думаю, что вы можете извлечь выгоду из синтаксического дерева больше, чем просто POS. Дерево позволит вам отделить два предложения от вашего предложения: «автомобиль не запускается в холодную погоду» и «нужно менять лопасти ветрового стекла» и в какой-то мере отделить другие части автомобиля, которые могут быть частью проблемы (если вы у меня много) от тех, которые просто упоминаются ниже в тексте.

Если система предназначена для использования в нескольких доменах, возможно, вам придется углубиться в синтаксический анализ. Возможно, Именованное Распознавание Сущности, но это, как правило, для вещей с надлежащими существительными.

Смежные вопросы