Я заметил, что pred() будет создавать прогнозы только для полных случаев. Я включил medianImpute
в опциях Preprocess, например, следующее:Предпочтение препроцесса R каретка и прогнозирование
train(outcome ~ .,
data = df,
method = "rf",
tuneLength = 5,
preProcess = c("YeoJohnson", "center", "scale", "medianImpute"),
metric = 'ROC',
trControl = train_ctrl)
}
Означает ли это, что я должен делать вменения для недостающих значений перед тренировкой набора? Если нет, я не могу создать прогноз для всех случаев в тестовом наборе. Я прочитал в книге доктора Куна, что предварительная обработка должна происходить во время перекрестной проверки ... Спасибо!
Спасибо, Лискандер. Это имеет большой смысл, поскольку я использую medianImpute. – user2300643
Это относится и к преобразованиям? – user2300643
Это зависит от трансформации. Если преобразование основано на среднем значении и дисперсии, например, тогда да. – LyzandeR