2015-04-17 2 views
1

У меня есть, вероятно, очень простой вопрос, но я не могу определить необходимые структуры управления в R, так как я довольно новичок в программировании R.Эффективный способ подсчета значений категориальных данных и печати в excel

ситуация выглядит следующим образом:

У меня есть data.frame с переменными десять факторов, которые имеют 4 уровня каждый (очень важно - не имеет значения). Теперь я хочу рассчитать количество уровней в каждой переменной и поместить их в новую фреймворк данных. Что должно выглядеть примерно так:

  Var1 Var2 etc.. 
Important 78  ... 
....  12  ... 
....  4  ... 
Unimportant 0  etc. 

В настоящее время, я могу думать только о подсчете каждой из исходных переменных с COUNT() из пакета plyr, а затем каким-то образом cbind() столбцы вместе. Тем не менее, это потребует много печатной работы, и я не могу подавить ощущение, что должен быть лучший способ решить это в R.

Однако я не могу найти необходимые команды для этого в R, поскольку я Я довольно новичок в программировании R.

ответ

1

Попробуйте это:

data.frame(sapply(your.dataframe, function(x) { summary(x) })) 

summary() является магическим мало R функция, которая даст вам число появлений каждого уровня фактора в (колонке или фрейма данных в данном случае) входной вектор.

Я также отмечу, что это решение будет работать только в том случае, если каждый столбец в your.dataframe имеет такое же количество факторов (что истинно и равно 4 в исходной задаче).

+1

благодарит много, что сработало как шарм. – mor3dr3ad

Смежные вопросы