Я пытаюсь создать классификатор для определения субъективности. У меня есть текстовые файлы, помеченные субъективными и объективными. Я немного потерял концепцию создания функций из этих данных. Я нашел лексику субъективного и объективного тега. Одна вещь, которую я могу сделать, - создать функцию наличия слов, содержащихся в соответствующем словаре. Возможно, количество слов присутствует в субъективном и объективном словаре. После этого я намерен использовать наивный Байес или SVM для разработки моделиОсобенности Векторы для построения классификатора для определения субъективности
Моей проблема состоит в следующем
- мой подход правильный?
- Могу ли я создать дополнительные функции? Если возможно, предложите некоторые или указать мне какую-нибудь бумагу или ссылку
- Могу ли я сделать какой-то тест, например, chi -sq и т. Д., Чтобы определить эффективные слова из словаря?
благодарит @denis за то, что указал мне нужные ресурсы и подтвердил подход. Это мне очень поможет –