2016-11-30 4 views
-4

У меня есть кадр данных класса, содержит переменные имени, пола (женщины, мужчины) и высоты. Мне нужно рассчитать описательную статистику по переменной высоты по полу. Я хочу, чтобы в выводе содержалось следующее: любая помощь была бы весьма признательна.Как рассчитать описательную статистику

Gender, Freq, Mean, Median, Mode, Std, Dev, min, max

+0

Обеспечить [воспроизводимым] (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r пример воспроизводимости). – Prradep

+0

нет данных? нет примеров? пожалуйста, следуйте рекомендациям о том, как опубликовать вопрос. Thanks –

+0

Какое исследование вы проделали? – Elin

ответ

0

попробовать с помощью этого

# assuming df is your data.frame and gender, height are column names 
tapply(df$height, df$gender, function(grp) c(Freq = length(grp), mean = mean(grp),mode = mode(grp),SD = sd(grp),min = min(grp),max = max(grp))) 
1

Функция summarise() из пакета dplyr будет хорошим решением:

library('dplyr') 
df %>% 
    na.omit %>% 
    group_by(gender) %>% 
    summarise(Freq = n(), #unshure, maybe n()/NROW(df) 
      Mean = mean(height), 
      Median = median(height), 
      Mode = moda(height), 
      Std.Dev = sd(height), 
      min = min(height), 
      max = max(height)) 

Где moda(x) является функцией для режима estimatin для образца с непрерывной переменной:

moda <- function(x, na.omit = TRUE){ 
    if (na.omit) x <- na.omit(x) 
    d <- density(x) 
    return(d$x[which.max(d$y)]) 
} 
+0

Поблагодарили u Andrey Kolyadin –

+0

В моей переменной высоты данных, имеющей отсутствующие значения, поэтому получение ошибки Ошибка в summaryise_impl (.data, dots): 'x' содержит отсутствующие значения Можно ли указать условие в вышеуказанном процессе –

+0

Сделано редактирование, должны работать сейчас –

Смежные вопросы