Я обнаружил, что многие примеры в книге APM доктора Маккса Куна имеют тенденцию охватывать наборы данных, которые имеют непрерывные переменные в качестве предиктора. Если работать с набором данных, имеющим порядковые коэффициенты, было бы целесообразно превратить эти переменные в фиктивные переменные и потерять естественный порядок переменных? Мой вопрос мотивирован необходимостью предварительной обработки (т. Е. Центра, масштабирования) набора данных. Я хотел бы знать, как другие подходят к этому в R?порядковые переменные и каретка при предварительной обработке
0
A
ответ
2
Если коэффициент имеет класс ordered
, он будет производить линейные комбинации, поддерживающие некоторый уровень полинома. См. The Basics of Encoding Categorical Data for Predictive Models и ?ordered
. Например:
> pred2 <- ordered(letters[1:5])
> model.matrix(~pred2)
(Intercept) pred2.L pred2.Q pred2.C pred2^4
1 1 -0.6325 0.5345 -3.162e-01 0.1195
2 1 -0.3162 -0.2673 6.325e-01 -0.4781
3 1 0.0000 -0.5345 -4.096e-16 0.7171
4 1 0.3162 -0.2673 -6.325e-01 -0.4781
5 1 0.6325 0.5345 3.162e-01 0.1195
attr(,"assign")
[1] 0 1 1 1 1
attr(,"contrasts")
attr(,"contrasts")$pred2
[1] "contr.poly"
Макс
+0
Можно также заказать дескриптор dummyVars? Или я должен просто оставить как упорядоченное(), а затем model.matrix(), которое должно обрабатывать все для меня, чтобы я мог preProcess()? Я не совсем понимаю полиномиальные преобразования ... – user2300643
Смежные вопросы
- 1. Почему отрицательное изображение используется при предварительной обработке?
- 2. Как показать прогресс при предварительной обработке файлов в FineUploader?
- 3. Как я могу надежно определить версию clang при предварительной обработке?
- 4. unterminated безусловная директивная ошибка при предварительной обработке кода C
- 5. Метод изменения размера изображения при предварительной обработке для нейронной сети
- 6. Подтвердить сертификат TLS при предварительной обработке ReverseProxy в GoLang
- 7. Произошла ошибка при обработке крючка предварительной установки подфайла
- 8. Получить выравнивание в предварительной обработке сборки ARM
- 9. Использование указателя в предварительной обработке в C++
- 10. Camunda удаляет все переменные при обработке
- 11. имитируют две коррелированные порядковые переменные в R
- 12. Как дифференцировать категориальные и порядковые переменные в регрессионном анализе?
- 13. Отладка путем перехода к предварительной обработке, компиляции, сборке и привязке
- 14. кластер порядковые данные
- 15. Динамический SQL и каретка разрывает
- 16. SPSS порядковые данные
- 17. Переместить прямоугольник при обработке?
- 18. Перевернутый каретка
- 19. Порядковые пакеты и алгоритмы классификации
- 20. Бит-поля и порядковые номера
- 21. Ошибка в предварительной обработке с пакетом тм в R
- 22. Мусороуборочный комбайн: CMS прервать вопрос о предварительной обработке?
- 23. Ошибка в частичной предварительной обработке в make-файле
- 24. Как Perl может совместно использовать глобальные переменные при параллельной обработке?
- 25. Расстояние предварительной выборки и степень предварительной выборки
- 26. Смешной каретка последовательность выхода при смешении FOR и FINDSTR
- 27. Переменные и контекст в обработке событий JS OOP
- 28. Почему моя каретка прыгает?
- 29. FIX внутренние порядковые номера
- 30. R каретка пакет (rpart)
Я думаю, что этот вопрос более подходит для [CrossValidated] (http://stats.stackexchange.com/), чем SO. – nrussell
Согласитесь, это не вопрос кодирования, но предполагает, что _not_ превратится в фиктивные переменные, так как это потеряет информацию. Лучше принуждать к числовому, если факторы «упорядочены». –
Приношу свои извинения. Я забыл упомянуть о том, что мне интересно узнать, как это сделать в R. – user2300643