2015-02-23 3 views
0

Я работаю над проблемой, которая по крайней мере, кажется, требует распознавания имен по имени, но я не уверен, как идти дальше, чем синтаксический анализ NER. То, что я пытаюсь сделать, - это анализировать информацию (вероятно, из твитов) о планировании событий. Так, например, я хотел бы иметь возможность автоматически разрешить ответ «да/нет» на вопрос «Are Beatles», играющий завтра? » от коротких сообщений, таких как:Извлечение отношения из NER parse

«Битлз отменили их шоу завтра» или «шоу Битлз все еще на завтра»

Я знаю, что НЭК получит меня близко, как он определит группу интересов и (если это указано), но есть много способов выразить интересующие меня концепции, например:

«Битлз готовятся завтра» или «Битлз не будет играть завтра».

Как я могу перейти от анализируемого представления NER к извлечения информации, представляющей интерес? Любые предложения будут высоко ценится.

ответ

1

Я думаю, вам следует искать по обнаружение события (факультативно - в Твиттере); возможно, также вопрос автоответчика, если ваш пример с да/нет вопросов был не просто иллюстрацией: если вы заранее знаете пользовательские потребности, эта информация может повысить качество системы.

Для начала есть несколько работ, посвященных обнаружению событий в Twitter: here и here.

В качестве базового уровня, вы можете создать список с положительными глаголами для вашего домена (быть, чтобы запланировать) и отрицательные глаголы (отменить, задержать) - просто начать с ручной росписи и расширить его синонимы из некоторого словаря, например WordNet. Также проверьте на отрицание - опять же, наличие предварительно заданных слов («не» в разных формах) в твиттере. Тогда, если есть отрицание, вы просто инвертируете значение.

Поскольку вы работаете с Твиттером и, скорее всего, будет только одно событие, упомянутое в твиттере, оно может работать очень хорошо.

Смежные вопросы