Найти и заменить отсутствующие значения со строкой означают

У меня есть фрейм данных с НСБУ и я хочу, чтобы заменить Nas с рядом означаетНайти и заменить отсутствующие значения со строкой означают

c1 = c(1,2,3,NA) 
c2 = c(3,1,NA,3) 
c3 = c(2,1,3,1) 

df = data.frame(c1,c2,c3) 

> df 
    c1 c2 c3 
1 1 3 2 
2 2 1 1 
3 3 NA 3 
4 NA 3 1

так что

источник

2013-07-23 Brian

Очень похоже на @ Батист Ответим

> ind <- which(is.na(df), arr.ind=TRUE) 
> df[ind] <- rowMeans(df, na.rm = TRUE)[ind[,1]]

источник

2013-07-23 14:23:46

+1 хорошее использование часто заданного аргумента' arr.ind' –

Я обнаружил, что если у меня есть целые строки NA, возникает ошибка. Правильно ли этот этикет представляет собой совершенно новый вопрос? – Brian

Мое решение

rwmns = rowMeans(df,na.rm=TRUE) 
df$c1[is.na(df$c1)] = rwmns[is.na(df$c1)] 
df$c2[is.na(df$c2)] = rwmns[is.na(df$c2)] 
df$c3[is.na(df$c3)] = rwmns[is.na(df$c3)] 
> df 
    c1 c2 c3 
1 1 3 2 
2 2 1 1 
3 3 3 3 
4 2 3 1

Есть ли более элегантный способ, особенно когда у кого-то много столбцов?

источник

2013-07-23 14:10:15 Brian

Отличная работа идет с вашим собственным решением. Вы можете использовать '[[' вместо индекса, поэтому каждая строка будет 'df [[col_name]] [is.na (df [[col_name]])] <- rwmns [is.na (df [[col_name]]) '. Таким образом, вы можете создать цикл или использовать семейство apply над именами столбцов, которые вы хотите выполнить. – Justin

Я думаю, что это работает,

df[which(is.na(df), arr.ind=TRUE)] <- rowMeans(df[!complete.cases(df), ], na.rm=TRUE)

источник

2013-07-23 14:20:38 baptiste

+1 приятное решение !! Гораздо лучше, чем моя ленивая «подавать»! –

Это немного избыточно, чтобы использовать как is.na, так и complete.cases; вероятно, более эффективный способ в двух строках – baptiste

Как это возможно? 'idx <- который (is.na (df), arr.ind = TRUE); df [idx] <- rowMeans (df [idx [, 1],], na.rm = TRUE) ' –

Использование apply (обратите внимание, что возвращаемый объект является matrix):

t(apply(df , 1 , function(x) { x[ is.na(x) ] = mean(x , na.rm = TRUE); x })) 
    c1 c2 c3 
[1,] 1 3 2 
[2,] 2 1 1 
[3,] 3 3 3 
[4,] 2 3 1

Мы используем любую анонимную функцию для изменения значения каждого NA в каждой строке к mean этой строки. Единственное преимущество заключается в том, что вам больше не нужно вводить текст, если количество строк увеличивается. Это не особенно эффективно или быстро в вычислительном смысле, но тем более в когнитивном смысле (вы не заметите, если у вас нет 000 000 строк).

источник

2013-07-23 14:21:32

Другой вариант na.aggregate из library(zoo) после транспонирования набора данных

library(zoo) 
df[] <- t(na.aggregate(t(df))) 
df 
# c1 c2 c3 
#1 1 3 2 
#2 2 1 1 
#3 3 3 3 
#4 2 3 1

источник

2015-11-11 05:01:56 akrun

Найти и заменить отсутствующие значения со строкой означают

ответ

Смежные вопросы