2015-12-08 1 views
1

У меня есть кадр данных с некоторыми столбцами, которые являются строками с отсутствующими значениями. Есть ли способ (с помощью dplyr) эффективно вычислять процент каждого столбца, который отсутствует, то есть «». Так что мне не нужно вычислять каждый процент столбцов, отсутствующий отдельно?Рассчитать процент отсутствующих строковых переменных в каждом столбце

Я попытался следующие, но dosnt похоже на работу

library(dplyr) 
#Create data frame 

a<- c(1,"",3,4) 
b<- c(2,2,3,4) 
c <- c("",2,"",3) 
x<- data.frame(a,b,c) 

x %>% 
summarise_each(funs(100*mean(is.null(.)))) 

#Result is 
#a b c 
#0 0 0 

Хотите, чтобы получить что-то вроде

#a b c 
#0.75 0 0.50 
+1

' ""' не 'NULL '. Это пустая строка. Очень разные. Простой намек на то, что '' "==" "' оценивает 'TRUE' – stanekam

ответ

0

в базе:

colSums(x!="")/nrow(x) 
    a b c 
0.75 1.00 0.50 
+1

или' colMeans() ' –

Смежные вопросы