Примечание: заголовок может вводить в заблуждение. Если вы понимаете мою проблему и думаете о чем-то более описательном, - пожалуйста, измените ее.Перекодировать отсутствующие данные из поля символов
У меня странная ситуация, когда ответы от опроса - все символы, а не числовые. Кажется, что R, на самом деле это не нравится. Предположим, я задал вопрос:
Q. In what area do you work?
East
West
Central
North
South
None of the above
Но респонденты были только с востока, запада и центра.
dat <- rep(c("East", "West", "Central"),100)
Теперь, для целей презентации, очень важно, что я включаю на север, юг и ни один из выше, даже если они не являются ни. Однако факторизация этих элементов сложна.
Давайте попробуем:
fac1 <- factor(dat, labels=c("East","West","Central","North","South","None of the above"))
Error in factor(dat, labels = c("East", "West", "Central", "North", "South", :
invalid labels; length 6 should be 1 or 3
В общем, что я хотел бы сделать, это фактор этих данных с пропущенными значениями. Таким образом, когда я набираю что-то вроде summary (fac1), он показывает, что у них есть 0 ответов в этой категории.
Должен быть более простой способ сделать это!
Должны быть впечатлены скоростью разума улья :) –