2012-06-14 2 views
0

Я перехожу из SAS в R. Мне нужна помощь в том, что я могу сделать очень легко в SAS, но я не знаю об этом в R.Применить функцию таблицы по нескольким категориальным переменным с разными категориями

У меня есть dataframe со многими категориальными переменными (все преобразованы в факторы), скажем, X1 - X50. Каждая переменная может иметь разные категории. Например,

  X1 can be Male, Female  
     x2 can be 1, 0  
     X3 can be 1, 2, 3, 4, 5  

Я хотел запустить команду таблицы на всех 50 категориальных переменных вместе, так что я получаю выходной сигнал dataframe с тремя колонками, которая выглядит следующим образом:

Group Variable Levels  Frequency 
    1  x1   Male   10  
    1  X1   Female  30  
    1  X2   1   5 
    1  X2   0   20  
    1  X2   Missing  15 
    1  X3   1   5 
    1  X3   2   5 
    1  X3   3   5 
    1  X3   4   10 
    1 X3   5   5 
    1 X3   Missing  5 
    2  
    2 
    2 
    2 
    2 

мне нужно одномерный распределение частот по группам. Таким образом, группа столбцов идентифицирует подмножество исходного фрейма данных для вычисления частот на.

ответ

0

Не то, что вы ищете, но в правильном направлении.

 mydata 
     X1 X2 
     Male A 
     Male B 
     Female C 
     Female A 
     Female C 
as.data.frame(unlist(lapply(mydata, table))) #produces the following, 
      unlist(lapply(mydata, table)) 
X1.Female        3 
X1.Male        2 
X2.A         2 
X2.B         1 
X2.C         2 
Смежные вопросы