Я побежал C4.5 Алгоритм обрезки в Weka с использованием 10-кратной проверки креста. Я заметил, что безупречное дерево имеет более высокую точность тестирования, чем обрезанное дерево. Я не мог понять причину того, почему обрезка дерева не улучшала точность тестирования?C4.5 Алгоритм дерева решений не улучшает точность
0
A
ответ
1
Обрезка уменьшает размер дерева решений, который (в общем) снижает точность обучения, но повышает точность при тестировании (невидимых) данных. Обрезка помогает смягчить переобучение, когда вы достигнете идеальной точности данных обучения, но модель (т. Е. Дерево решений) терпит неудачу, когда он видит невидимые данные.
Таким образом, обрезка должна улучшить точность тестирования. С вашего вопроса трудно сказать, почему обрезка не улучшает точность тестирования.
Однако вы можете проверить точность своего обучения. Просто проверьте, уменьшает ли обрезка точность обучения или нет. Если нет, то проблема находится где-то в другом месте. Вероятно, тогда вам нужно подумать о количестве функций или размере набора данных!
Смежные вопросы
- 1. Каково значение имени алгоритма дерева решений «c4.5»?
- 2. Код дерева дерева решений/алгоритм
- 3. c4.5 алгоритм отсутствует значения
- 4. Почему Adtree имеет большую точность, чем C4.5
- 5. C4.5 алгоритм с неограниченными атрибутами
- 6. Почему алгоритм C4.5 использует обрезку, чтобы уменьшить дерево решений и как обрезка влияет на точность предсказания?
- 7. Как повысить точность дерева решений в matlab
- 8. Можно ли выбрать алгоритм дерева решений для использования в sklearn?
- 9. Алгоритм кластеризации сверху ученика дерева решений
- 10. Совершенная классификация дерева решений
- 11. Выбор дерева решений и выбор алгоритма
- 12. scikit изучить модель дерева решений
- 13. Как алгоритм C4.5 обрабатывает непрерывные данные?
- 14. Обучение дерева решений для обнаружения лиц с несколькими видами зрения
- 15. Лучший алгоритм обучения для создания дерева решений в java?
- 16. Эффективный алгоритм предсказания из дерева решений (с использованием R)
- 17. Интерактивный классификатор дерева решений
- 18. Объяснение дерева принятия решений
- 19. Deserialization дерева двоичных решений
- 20. Реализация дерева решений
- 21. Визуализация дерева решений
- 22. Обработка дерева решений
- 23. Глубина дерева принятия решений
- 24. Построение дерева решений
- 25. Алгоритм построения дерева дерева
- 26. Понимание изменения решений алгоритм
- 27. Алгоритм дерева
- 28. Реализация дерева решений для возврата следующей функции для разбиения дерева
- 29. Почему увеличение данных не улучшает точность классификации текстур в CNN?
- 30. Алгоритм дерева генеалогии
Спасибо! Я проверил, что обрезка снижает точность тренировки. Любые предложения о том, как двигаться вперед? – Dan
Является ли это потому, что мое ненарушенное дерево перерабатывает данные? Будет ли больше данных улучшать производительность восходящего дерева? Моя точность тестирования до неуправляемой составляла около 98%, что уменьшилось до 97% для обрезанного – Dan
обрезанное дерево должно иметь более высокую точность по сравнению с тестовыми данными, но поскольку после обрезки вы не получаете улучшенной производительности, вы можете попробовать, рассмотрев дополнительные данные о тренировках. Случай может быть немного исключительным, но в целом обрезанное дерево должно работать лучше, чем необработанное дерево над тестовыми экземплярами. –