2015-04-20 5 views
3

Я довольно новичок в моделировании данных и R, интересно, мог ли кто-нибудь дать мне несколько советов.R: Caret Package preProcess()

Я использую R для тиражирования модели, которую я создал в модуле SPSS, чтобы затем попытаться ее улучшить. В настоящее время я строю базовую линейную модель с использованием пакета caret.

Я использовал preProcess() для масштабирования и центрирования своих числовых полей, включая числовую переменную, которую предсказывает модель.

preProcValues <- preProcess(Data_Numeric, method = c("center", "scale")) 
Data_PreProc <- predict(preProcValues, Data_Numeric) 

Когда я произвожу модель я считаю, что это результаты предварительной обработки в более точной модели, однако, я не уверен, как сделать масштабируется и центрированный результат и получить «результат» а. Модель используется в качестве инструмента ценообразования, поэтому мне нужно разжать и центрировать ее, если это имеет смысл?

ответ

4

Для centering среднее значение выборки вычитается, а центрированные значения делятся на стандартное отклонение для scaling.

Это было бы легко оправиться от следующих отношений.

  • данные
  • по центру = данные - среднее (данные)
  • масштабируется = центрируется/с.о. (данные)
+0

Спасибо, это должен делать эту работу. –