1

I классифицирован 20 нг набора данных с к-яя 200, например, в каждой категории с 80-20 железно-тест раскола, где я нашел следующие результатыПочему KNN имеет низкую точность, но высокую точность?

enter image description here

Здесь точность довольно низкая, но как точность высока, когда точность низкая? не являются прецизионными формулами TP/(TP + FP)? Если да, то высокий точный классификатор должен генерировать высокий истинный положительный результат, который приведет к высокой точности, но как K-nn генерирует высокую точность со слишком низким истинным положительным коэффициентом?

+0

Не могли бы вы выбрать более информативное название для вопроса? Это поможет другим найти его. – Sentry

+1

@Sentry thanx для предложения, я согласен, что иногда я выбираю название, которое действительно неоднозначно, однако я отредактировал его, чтобы сделать его более релевантным для проблемы. –

+0

Это намного лучше, thx. Теперь другие люди могут найти это легче, и вы можете получить больше голосов и ответов :) – Sentry

ответ

2

Напомним, что это эквивалент True Positive rate. Задачи классификации текста (особенно для поиска информации, но также и для категоризации текста) показывают компромисс между отзывом и точностью. Когда точность очень высокая, отзыв имеет тенденцию быть низким, а наоборот. Это связано с тем, что вы можете настроить классификатор, чтобы классифицировать более или менее экземпляры как положительные. Чем меньше случаев вы классифицируете как положительные, тем выше точность и тем ниже отзыв.

Для обеспечения того, чтобы показатель эффективности коррелировал с точностью, вы фокусируетесь на F-мерке, которая усредняет значения и точность (F-measure = 2 * r * p/(r + p)).

Неклассифицированные классификаторы следуют учебному процессу, в котором они пытаются оптимизировать точность или ошибку. K-NN, будучи ленивым, не имеет учебного процесса, и, следовательно, он не пытается оптимизировать меру эффективности. Вы можете играть с разными значениями K, и интуитивно, чем больше K, тем выше отзыв и тем ниже точность, и наоборот.

Смежные вопросы