2015-02-15 4 views
1

Так что у меня есть идея для классификации настроений предложений, касающихся конкретного продукта бренда (в данном случае pepsi). В принципе, скажем, я хотел выяснить, как люди относятся к вкусу пепси. Учитывая эту проблему, я хочу построить абстрактные шаблоны предложений, в основном возможные структуры предложений, которые указывают на мнение о вкусе pepsi. Вот один пример для три слова предложений:Возможный подход к анализу сентиментальности (извиняюсь, я очень новичок в НЛП)

[Pepsi] [tastes] [good, bad, great, horrible, etc.] 

Я тогда полистать мою базу данных предложений, и попытаться найти те, которые соответствуют этой конкретной структуре. Как только у меня есть это, я могу просто извлечь третий компонент и получить представление об этом конкретном аспекте (вкусе) этого конкретного объекта (pepsi).

Приложение для этого будет смотреть на твиты, так что это может привести к нескольким твитам за последний год или около того, но этого было бы недостаточно, чтобы получить точное чтение общих настроений, поэтому я бы создал другие возможные структуры, такие как:

[I] [love, hate, dislike, like, etc.] [the taste of pepsi] 
[I] [love, hate, dislike, like, etc.] [the way pepsi tastes] 
[I] [love, hate, dislike, like, etc.] [how pepsi tastes] 

И так далее и т. д.

Конечно, большинство твитов не будет таким простым, были бы возможные слова, которые означали бы то же самое, что и pepsi, или слова между основными компонентами и т. Д. - отклонения, которые было бы нецелесообразно учитывать.

Я ищу только общее направление или подполе анализа чувств, которое обсуждает эту конкретную проблему. У меня нет проблем с большим списком возможных структур, это просто отклонения от структур, которые меня волнуют. Я знаю, что это что-то вроде дерева синтаксиса, но большинство из того, что я прочитал о них, только что было о генерации текста - в этом случае я пытаюсь сопоставить предложение с структурой и вытаскивать сущность, и компоненты аспекта, чтобы получить основной ответ на три слова.

ответ

0

Этот шаблонный подход является основной идеей моих собственных работ по разработке настроений. Вы можете найти исследование EBMT (примерный машинный перевод), интересный, как аналогичный (но недостаточно изученный) подход в области машинного перевода.

Познакомьтесь с Wordnet, чтобы автоматически генерировать рефракции (есть сотни документов, которые основаны на WordNet, некоторые из которых будут вам полезны). (The WordNet book сейчас стареет, но стоит, по крайней мере, прочитать прочитанное, если вы можете найти его в библиотеке.)

Я нашел Bing Liu's book очень полезный обзор всех различных аспектов и подходов к интеллектуальному анализу, а также хорошее введение для дальнейшего чтения. (Отзывы Amazon UK настолько негативны, что я задавался вопросом, была ли это другая книга! Однако обзоры Amazon в США более позитивны.)

Смежные вопросы