Scikit
overfitting, когда я использую его для машинного обучения. Например, для регрессии я использую decisiontree
.scikit overfitting все время
Учебный комплект дал мне 0,9998 для r_value
; испытательный комплект дал мне 0,3134 для r_value
; после перекрестной проверки тестовый комплект дал мне 0,1695 для r_value
.
И если я использую функцию cross_val_predict
, должен ли я добавить целевое значение тестового набора? Или это даст мне ошибку? Мне интересно, как избежать ввода целевого значения тестового набора?
Что странно? Все, что вы делаете, это вызов функции библиотеки и печать ответа. Почему вы думаете, что у вас есть проблема? –
Потому что набор тренировок дал мне высокий r_value, и тестовый набор дал мне низкое значение r_value. Как я могу получить аналогичные значения r_values для набора тренировок и набора тестов? – Arthur