Я хочу знать, если я создаю дерево решений. Как ID3 из набора обучения и проверки, но A не работает. В то же время у меня есть другое дерево решений B также в ID3, сгенерированном из того же набора обучения и проверки, но B обрезается. Теперь я тестирую как A, так и B на будущем немаркированном тестовом наборе, всегда ли это, что обрезанное дерево будет работать лучше? Любая идея приветствуется, спасибо.Эффект обрезки дерева принятия решений
ответ
Я думаю, что нам нужно сделать различие понятнее: обрезают деревья всегда работают лучше на проверки набора, но не обязательно на тестирования набора (на самом деле это также равной или худшей производительности на тренировка комплект). Я предполагаю, что обрезка делается после того, как строится дерево (то есть: после обрезки) ..
Помните, что вся причина использования набора проверки, чтобы избежать переобучения над обучающим набором данными, и ключ точка здесь обобщение: мы хотим получить модель (дерево решений), которая обобщается за пределами экземпляров, которые были предоставлены в «время обучения» для новых невидимых примеров.
Обрезка Предполагаемый для улучшения классификации путем предотвращения переобучения. Поскольку обрезка будет происходить только в том случае, если она улучшает тариф классификации в наборе валидации, обрезанное дерево будет работать также или лучше, чем необработанное дерево во время проверки.
Плохая обрезка может привести к неправильным результатам. Хотя часто требуется желаемый размер дерева решений, вы обычно стремитесь к лучшим результатам при обрезке. Поэтому , как - это суть обрезки.
Я согласен с 1-м ответом от @AMRO. Post-pruning
- наиболее распространенный подход к обрезке дерева решений, и это делается после того, как дерево построено. Но, Pre-pruning
также можно сделать. в pre-pruning
, дерево обрезается, останавливая его строительство раньше, используя заданное пороговое значение. Например, решая не разбивать подмножество обучающих кортежей на данном узле.
Тогда этот узел становится листом. Этот лист может содержать самый частый класс среди подмножества кортежей или вероятность этих кортежей.
- 1. Глубина дерева принятия решений
- 2. Объяснение дерева принятия решений
- 3. Исходный код дерева принятия решений
- 4. Деревья принятия решений для обрезки в Python
- 5. Рекурсия для формы дерева принятия решений
- 6. Дерево принятия решений использует Y-переменную в принятии решений дерева
- 7. Преобразование таблицы принятия решений в дерево принятия решений
- 8. Дерево решений обрезки
- 9. Визуализация деревьев принятия решений
- 10. принятия решений в R
- 11. Многофакторного Дерево принятия решений обучаемого
- 12. вопрос о деревьях принятия решений
- 13. Код дерева дерева решений/алгоритм
- 14. Использование блока catch для принятия решений по программе/принятия решений
- 15. Карты принятия решений PokerGame
- 16. Как построить правила принятия решений на основе дерева в R
- 17. Прогнозирования данных с использованием Дерева принятия решений о rpart
- 18. Выбор значения CP для обрезки дерева решений с использованием rpart
- 19. Изменение целевой функции принятия дерева
- 20. Инкрементальное дерево принятия решений в matlab
- 21. Помощь Понимание деревьев валидации и принятия решений
- 22. принятия решений полнота и несекретные данные
- 23. Деревья принятия решений Перекрестные вопросы валидации
- 24. деревья принятия решений с принудительной структурой
- 25. Мера энтропии Шаннона в деревьях принятия решений
- 26. Таблица принятия решений к псевдокоду
- 27. Чистая реализация «матрицы принятия решений»
- 28. PHP контактную форму принятия решений
- 29. поддержки принятия решений JSF Hibernate
- 30. Деревья принятия решений: Рекомендуемые библиотеки
Вы ищете конкретные случаи, когда обрезанное дерево может работать хуже? –