2016-02-04 2 views
-1

Я много пробовал из других соответствующих обсуждений переполнения стека, но не смог найти то, что искал.Оценка настроения полного сообщения с использованием Python NLTK

Что я хочу, так это: для данного сообщения (т. Е. Абзаца с одним или несколькими предложениями), я хочу иметь оценку настроений в диапазоне от -5 до +5.

Модуль Valder с пакетом nltk.sentiment предоставляет три разных значения: pos, neu и neg. Но этого я не хочу.

Есть ли способ сделать это, используя nltk sentiwordnet?

ответ

0

Вам необходимо будет обучить свой набор данных из корпуса или предварительно определенного набора данных, который имеет отдельные положительные и отрицательные обучающие наборы, а затем сравните ваши данные с этим.

Алгоритм заключается в том, как вы сравниваете свой набор данных тренировки с набором тестовых данных, чтобы получить числовое значение того, насколько подобен набор данных.

Имейте в виду, что набор данных обучения должен быть аналогичен набору тестовых данных.

Затем вы можете использовать различные алгоритмы, такие как наивные байесовские или MultiBinomial т.д.

+0

Не обязательно. Я не хочу анализировать настроения, специфичные для домена. Например, SentiWordNet имеет значения настроений для большинства часто используемых слов на английском языке. Проблема заключается в получении чувства для всего предложения. – user1151324

Смежные вопросы