Я использую регрессионную модель случайного леса в R, и я нашел параметр corr.bias, который, согласно руководству, является «экспериментальным», мои данные нелинейны, и я просто задайте вопрос, может ли установить этот параметр в true, чтобы улучшить результаты, а также я не знаю точно, как это работает для нелинейных данных, поэтому я очень признателен, если кто-то может объяснить мне, как это смещение коррекции работает в случайном пакете леса, и если это может улучшить мою регрессионную модель или нет.Параметр corr.bias в модели случайной лесной регрессии в R
ответ
Короткий ответ заключается в том, что он выполняет простую коррекцию, основанную на линейной регрессии по фактическим и установленным значениям.
От regrf.c
:
/* Do simple linear regression of y on yhat for bias correction. */
if (*biasCorr) simpleLinReg(nsample, yptr, y, coef, &errb, nout);
и первые несколько строк этой функции просто:
void simpleLinReg(int nsample, double *x, double *y, double *coef,
double *mse, int *hasPred) {
/* Compute simple linear regression of y on x, returning the coefficients,
the average squared residual, and the predicted values (overwriting y). */
Итак, когда вы подходите регрессионный случайный лес с corr.bias = TRUE
объектной моделью возвращается будет содержать coef
элемент, который будет просто двумя коэффициентами из линейной регрессии.
Тогда при вызове predict.randomForest
это происходит:
## Apply bias correction if needed.
yhat <- rep(NA, length(rn))
names(yhat) <- rn
if (!is.null(object$coefs)) {
yhat[keep] <- object$coefs[1] + object$coefs[2] * ans$ypred
}
Нелинейный характер ваших данных, вероятно, не обязательно актуален, но коррекция смещения может быть очень плохой, если соотношение между встроенным и фактическим значения очень далеки от линейных.
Вы всегда можете подобрать модель, а затем сами построить фактические значения и установить, поможет ли коррекция на основе линейной регрессии.
- 1. Остатки случайной лесной регрессии (Python)
- 2. Размер выборки в случайной лесной регрессии
- 3. Модели регрессии расширения В R
- 4. Оценка модели регрессии с r²
- 5. ошибка регрессии в R
- 6. лесной участок три формы в R
- 7. Алгоритм подмножества регрессии в R
- 8. R регуляризуйте коэффициенты в регрессии
- 9. Рекурсивные регрессии в R
- 10. петли в R - регрессии
- 11. нелинейной регрессии в R
- 12. Циклические регрессии в R
- 13. Получить ошибку тест в модели логистической регрессии в R
- 14. Как цикл формулы в модели регрессии в R
- 15. H2o случайный лесной участок на r
- 16. Интерпретация взаимодействий в модели регрессии
- 17. Экспорт случайной модели леса из R в OpenCV
- 18. Замена цикла в R: многомерный параметр регрессии k-ближайшего соседа
- 19. ddply для регрессии в R
- 20. Ошибка при настройке модели векторной регрессии поддержки в R
- 21. Построить результаты многомерной модели логистической регрессии в R
- 22. Установите границу решения для модели логистической регрессии в R
- 23. сюжета несколько кривых ROC для модели логистической регрессии в R
- 24. Множественные NA для последних переменных модели линейной регрессии в R
- 25. Модели логистической регрессии в ggplot2
- 26. Сохранение модели регрессии в pySpark
- 27. Лесной участок от logistf
- 28. Как определить гетеросексуальность в случайной модели?
- 29. Максимизировать функцию нелинейной регрессии в R
- 30. Прогнозы регрессии хребта в R