Я заметил, что при использовании фиктивного кодирования для установки моих линейных моделей R исключает определенные параметры при формировании матричной модели. Каков алгоритм R для этого?Что такое R-алгоритм для матричной модели машинного кода?
ответ
Это не хорошо документирована, но она восходит к тому, что поворотное алгоритм, лежащий в основе кода LAPACK использует:
z <- .Call(C_Cdqrls, x, y, tol, FALSE)
...
coef <- z$coefficients
pivot <- z$pivot
...
r2 <- if(z$rank < p) (z$rank+1L):p else integer()
if (is.matrix(y)) {
....
} else {
coef[r2] <- NA
## avoid copy
if(z$pivoted) coef[pivot] <- coef
...
}
Если вы хотите, чтобы вырыть назад дальше, необходимо посмотреть в dqrdc2.f, в котором говорится (для чего это стоит):
c dqrdc2 использует преобразования домовладельцев в compu te qr
c факторизация матрицы n на p x. ограниченная колонка
c стратегия поворота на основе 2-норм приведенных столбцов
c перемещает столбцы с нулевой нормой к правому краю
c матрицей x. эта стратегия означает, что последовательный
Эффекты степени свободы могут быть вычислены естественным образом.
На практике я вообще обнаружил, что R устраняет последний (крайний правый столбец) из набора коллинеарных предикторов ...
Спасибо. Я думаю, вы говорите о линейно зависимых столбцах при выполнении QR-факторизации. Я говорю о стадии формирования модельной матрицы. Эти две стадии решают проблему линейной зависимости, но я считаю, что они немного отличаются. Вы говорите о том, как линейно зависимые столбцы, которые уже находятся в матрице модели, перемещаются из ранга матрицы путем поворота. Я спрашиваю, как R определяет, какие параметры исключены, при формировании модели. НЕ ПОСЛЕ –
- 1. Что такое алгоритмы машинного обучения
- 2. Что такое Усиление машинного обучения?
- 3. HLL для машинного кода
- 4. Что такое эквивалент numpy для матричной функции R?
- 5. Что такое метрики для оценки алгоритма машинного обучения
- 6. Что такое индуктивное смещение по машинного обучения
- 7. Определение машинного кода
- 8. Что такое «прогностический» элемент машинного обучения
- 9. Что такое «вес» в алгоритмах машинного обучения
- 10. Что такое вектор в терминах машинного обучения
- 11. инструкция машинного кода для программы
- 12. Аналоговая инструкция для машинного кода
- 13. Что такое презентатор модели?
- 14. Что такое «набрав модели»?
- 15. Что такое покрытие кода?
- 16. Экзамен - кодировка машинного кода
- 17. Оптимизация машинного кода MIPS
- 18. Камеру DirectX для просмотра на основе матричной модели 3D-модели?
- 19. Что такое смысл кода?
- 20. Что такое оптимизация кода?
- 21. Что такое строка кода?
- 22. Что такое раздел кода?
- 23. Что такое «Конфигурация кода»?
- 24. Haskell: Разрешение отправки для исправления машинного кода
- 25. Код MIPS .data для машинного кода
- 26. Что такое объекты модели Python?
- 27. Как обновлены модели машинного обучения?
- 28. Что такое создание модели домена?
- 29. Код машинного кода от C
- 30. Что такое хороший инструмент для аннотирования кода?
Может быть, начать с чтения о 'contrasts' аргумент'? Лм ', что приведет к'? model.matrix', а также документации в '' contr.treatment'. Возможно, книга по теории линейной модели может быть в порядке, так как в документации предполагается, что у вас есть базовое понимание математики. – joran
@joran Я считаю, что понимаю контраст и кодирование. Манекен-кодирование - всего лишь способ группировки коэффициентов в уравнении регрессии, но неясно, как R делает выбор группировки, поскольку выбор группы не уникален. Для простых случаев я понимаю контрасты по умолчанию, но для сложных случаев мое понимание, похоже, разваливается. –
Тогда я подозреваю, что документация, о которой я говорил, должна быть достаточной. Значения по умолчанию показаны в параметрах («контрасты») '. – joran