Я использую Naive Bayes из Weka, чтобы сделать классификацию текста. У меня есть два класса для моих предложений: «Позитивный» и «Негативный». Я собрал около 207 предложений с положительным смыслом и 189 предложений с отрицательным значением, чтобы создать свой тренировочный набор.Хорошая производительность только для одного класса наивных заливов
Когда я запустил Naive Bayes с тестовым набором, содержащим предложения с сильным отрицательным значением, такие как слово «ненависть», точность результатов довольно хорошая, около 88%. Но когда я использую предложения с положительным значением, такие как слово «любовь», как тестовый набор, точность намного хуже, около 56%.
Я думаю, что эта разница, вероятно, имеет какое-то отношение к моему набору тренировок и особенно к его «положительным» предложениям.
Можете ли вы придумать любую причину, которая могла бы объяснить эту разницу? Или, может быть, способ помочь мне узнать, где проблема начинается?
Большое спасибо за ваше время,
Nantia
вы пытались с помощью перекрестной проверки? ваша ситуация кажется просто совпадением. – berkay