Итак, вы вручную создаете три фиктивных столбца в excel и хотите импортировать их в R? Если впоследствии вы импортируете эти столбцы как числовые, а не факторные, проблем не будет.
Ну, я все же должен напомнить вам, что R может кодовым фактором использовать фиктивные переменные, через model.matrix()
. Поэтому никогда не нужно делать это самостоятельно. Конечно, можно использовать один столбец с «красным», «синим» и «желтым» в excel и экспортировать его в R как фактор.
colour <- gl(3,2,labels=c("red","blue","yellow"))
model.matrix(~ colour - 1)
# colourred colourblue colouryellow
#1 1 0 0
#2 1 0 0
#3 0 1 0
#4 0 1 0
#5 0 0 1
#6 0 0 1
Еще один быстрый вопрос. Использование model.matrix
для цвета фактора и других переменных факторов - как я могу включить это в свою модель? Когда я вызываю линейную модель (например) lm(response ~ predictor.1 + predictor.2 + colour)
, она автоматически вызовет фиктивные переменные или мне нужно присвоить model.matrix вектору?
model.matrix
является обычной службы, для подгонки модели процедур, таких как lm
, glm
и т.д. Пользователь может просто использовать формулу, то матричная модель будет построена за сценой. Таким образом, вам даже не нужно самостоятельно получать модельную матрицу.
Для опытного пользователя иногда он может использовать внутренние подпрограммы lm.fit
или даже .lm.fit
. Прочитайте ?lm.fit
для этих процедур. Эти подпрограммы не принимают модельную формулу, а модельную матрицу X
и вектор отклика y
. В такой ситуации пользователь несет полную ответственность за то, чтобы самостоятельно произвести X
и y
.
@ZheyuanLi Итак, ваше высказывание импортирует их как 'df $ red <- as.numeric (df $ red)' или что-то вроде этого – Danib90