2016-04-25 7 views
0

Я использую IBk Weka для выполнения классификации по тексту (твиты). Я преобразовываю данные обучения и тестирования в векторное пространство, и когда я выполняю классификацию по тестовым данным, лучший результат исходит от K = 1. Данные обучения и тестирования отделены друг от друга. Почему K = 1 дает лучшую точность?KNN, обеспечивающий максимальную точность с K = 1?

+0

Что векторное пространство, что вы используете? n-gram counts? – Aaron

+0

Я вектурирую его через Weka и используя Bigrams как токенизатор. – Chechi

ответ

0

Потому что вы используете векторы; поэтому на k=1 значение, которое вы получите за близости (для k=1) является более важным, чем то, что общий класс в случае k=n (например: при k=5)

Смежные вопросы