2015-10-10 3 views
1

кажется мне, что процедура прогнозирования со случайным лесом в регрессионном случае нетривиальна, как я получить другой результат, то встроенная процедура:Ручного расчета RandomForest() невязки

set.seed(1) 
wyn <- randomForest(y = iris[, 1], x = iris[, -1]) 
(wyn) #Mean of squared residuals: 0.1341068 

response=predict(wyn, iris[, -1]) # is it ok ? below to lines gives different output 

mean((iris[,1]-wyn$predicted)^2) #returns 0.1341068 
mean((iris[,1]-response)^2) # returns 0.07259335 


plot(wyn$predicted,response) # almost but not identical 

, что случилось с мое использование predict() выше?

ответ

1

хорошо, теперь я знаю:

#returns out-of-bag error 
mean((iris[,1]-wyn$predicted)^2) #returns 0.1341068 

#returns error calculated on whole dataset 
mean((iris[,1]-response)^2) # returns 0.07259335 
Смежные вопросы