Я использую Weka IBk для текста classificaiton. Каждый документ в основном является коротким предложением. Учебный набор содержит 15 000 документов. Во время тестирования я вижу, что k = 1 дает лучшую точность? Как это можно объяснить?Почему k = 1 в KNN дает лучшую точность?
ответ
Если вы запрашиваете своего учащегося с тем же набором данных, с которым вы обучались с k = 1, то выходные значения должны быть идеальными, если у вас есть данные с теми же параметрами, которые имеют разные значения результата. Проведите некоторое чтение по переобучению, так как оно относится к ученикам KNN.
В случае, когда вы запрашиваете тот же набор данных, с которым вы обучались, запрос будет вводиться для каждого учащегося с некоторыми заданными значениями параметров. Поскольку эта точка существует у ученика из набора данных, с которым вы обучались, ученик будет соответствовать той точке обучения, которая будет ближе всего к значениям параметров, и поэтому выводит любое значение Y для этой точки обучения, которое в этом случае совпадает с точкой, которую вы спросил.
Возможности:
- Подготовка данных с помощью тестов данных являются одни и те же данные
- тесты данных имеют высокое сходство с подготовки данных
- Границы между классами очень ясно
Оптимальное значение для K зависит от данных. В общем случае значение k может уменьшить влияние шума на классификацию, но делает границы между каждой классификацией более размытыми.
- 1. KNN, обеспечивающий максимальную точность с K = 1?
- 2. Почему KNN имеет низкую точность, но высокую точность?
- 3. Выбор k для KNN в Matlab
- 4. Почему явный совет дает лучшую производительность?
- 5. Как получить лучшую точность с двойным диапазоном 0 -1?
- 6. Изменение значения k в алгоритме kNN - Java
- 7. Как измерить точность классификатора knn в python
- 8. Почему LINQ 2 sql дает лучшую производительность?
- 9. , который дает лучшую производительность?
- 10. Идеальное значение k в kNN для классификации
- 11. Как найти точность с использованием нескольких значений k в классификаторе knn (matlab)
- 12. knn- такой же k, другой результат
- 13. KNN Выбор метки класса при k = 4
- 14. Почему KNN в quickminer дает проблемы с памятью?
- 15. CLLocationManager обеспечивает лучшую точность для iphone
- 16. Почему «K» .Length дает мне неправильный результат?
- 17. Напомним, Напомним, скорость @ K и точность в топ-K рекомендации
- 18. Какой метод дает лучшую производительность?
- 19. Как реализовать KNN с помощью Matlab и вычислить процентную точность
- 20. Python - Почему эта простая функция факторизации дает лучшую производительность?
- 21. Используйте knn с k = 1 и классифицируйте тестовый набор данных в R
- 22. Повышение точности классификатора knn
- 23. Python: Какой способ дает более высокую точность
- 24. Почему перестановка используется в классификаторе knn?
- 25. Что дает лучшую производительность: LEN (а [: - 1]) или LEN (а) -1
- 26. какая версия openssl дает лучшую скорость?
- 27. Как найти точность классификатора k-nn
- 28. источник оценки плотности knn (k ближайший сосед) в matlab
- 29. Почему 1 .__ add __ (1) дает синтаксическую ошибку?
- 30. Точность c_k = a + (N + k) * b
Спасибо за ваш ответ. Я обращаюсь к моему ученику с данными испытаний, а не с учебным набором данных. – Chechi