При использовании формул с коэффициентами, приведенные модели обозначают коэффициенты XY, где X - это имя фактора, а Y - его конкретный уровень. Я хочу иметь возможность создать формулу из названий этих коэффициентов.Преобразование имен коэффициентов в формулу в R
Причина: Если я поместил лассо в разреженную матрицу дизайна (как я делаю ниже), я хотел бы создать новый объект формулы, который содержит только термины для ненулевых коэффициентов.
require("MatrixModels")
require("glmnet")
set.seed(1)
n <- 200
Z <- data.frame(letter=factor(sample(letters,n,replace=T),letters),
x=sample(1:20,200,replace=T))
f <- ~ letter + x:letter + I(x>5):letter
X <- sparse.model.matrix(f, Z)
beta <- matrix(rnorm(dim(X)[2],0,5),dim(X)[2],1)
y <- X %*% beta + rnorm(n)
myfit <- glmnet(X,as.vector(y),lambda=.05)
fnew <- rownames(myfit$beta)[which(myfit$beta != 0)]
[1] "letterb" "letterc" "lettere"
[4] "letterf" "letterg" "letterh"
[7] "letterj" "letterm" "lettern"
[10] "lettero" "letterp" "letterr"
[13] "letters" "lettert" "letteru"
[16] "letterw" "lettery" "letterz"
[19] "lettera:x" "letterb:x" "letterc:x"
[22] "letterd:x" "lettere:x" "letterf:x"
[25] "letterg:x" "letterh:x" "letteri:x"
[28] "letterj:x" "letterk:x" "letterl:x"
[31] "letterm:x" "lettern:x" "lettero:x"
[34] "letterp:x" "letterq:x" "letterr:x"
[37] "letters:x" "lettert:x" "letteru:x"
[40] "letterv:x" "letterw:x" "letterx:x"
[43] "lettery:x" "letterz:x" "letterb:I(x > 5)TRUE"
[46] "letterc:I(x > 5)TRUE" "letterd:I(x > 5)TRUE" "lettere:I(x > 5)TRUE"
[49] "letteri:I(x > 5)TRUE" "letterj:I(x > 5)TRUE" "letterl:I(x > 5)TRUE"
[52] "letterm:I(x > 5)TRUE" "letterp:I(x > 5)TRUE" "letterq:I(x > 5)TRUE"
[55] "letterr:I(x > 5)TRUE" "letteru:I(x > 5)TRUE" "letterv:I(x > 5)TRUE"
[58] "letterx:I(x > 5)TRUE" "lettery:I(x > 5)TRUE" "letterz:I(x > 5)TRUE"
Из этого я хотел бы иметь формулу
~ I(letter=="d") + I(letter=="e") + ...(etc)
Я проверил формулу() и all.vars() безрезультатно. Кроме того, запись функции для синтаксического анализа это немного боль из-за различных типов терминов, которые могут возникнуть. Например, для x: letter, когда x является числовым значением, а буква - фактором, или I (x> 5): буква как другой раздражающий случай.
Так что я не знаю о какой-либо функции для преобразования между формулой и ее символьным представлением и обратно?
Это не формула, которую я признаю в R – 2010-11-25 22:00:24
Возможно, я неправильно понимаю, но вы, похоже, не полностью гребли формулы модели R. Вы не включаете в формулу XY биты, вы включаете X и `model.matrix()` и `model.frame()` делаете свою вещь, чтобы расширить уровни X до соответствующих столбцов матрицы модели, XY. – 2010-11-25 22:06:30