Использование случайного леса с помощью scikit. RF переназначает данные, а результаты прогнозирования плохие.Удельная проверка креста с помощью случайного леса
overfit не зависит от параметров РФ: NBtree, Depth_Tree
Overfit происходит со многими различными параметрами (тестировал через grid_search).
Чтобы исправить ошибку: Я корректирую исходные данные/сбрасывая выборку с некоторыми результатами , чтобы повлиять на фитинг (образец для предварительной обработки проб вручную).
Loop on random generation of RF fits,
Get RF prediction on the data for prediction
Select the model which best fits the "predicted data" (not the calibration data).
Это Монте-Карлос очень потребляя, Просто интересно, если есть другой способ сделать перекрестной проверки на случайном лесу? (т. е. НЕ оптимизация гиперпараметров).
EDITED
Просто прочитайте документы. Особенно [это] (http://scikit-learn.org/stable/modules/grid_search.html#grid-search). – sascha
Вы используете oob_score или точность, когда говорите, что ваша модель перерабатывает? –
Глядя на матрицу путаницы False Positive/Negative .... Обучение в порядке. Но, из образца несовместимо хорошо (обычно плохо, иногда ОК). – Brook