2016-07-25 3 views
-1

У меня есть набор данных переписи с некоторыми недостающими переменными, указанными ?, При проверке неполных случаев в R это говорит о том, что их нет, потому что R принимает ? как допустимый символ. Есть ли способ изменить все ? на NA? Я хотел бы запустить множественное вменение с использованием пакета мышей, чтобы заполнить недостающие данные после.Как изменить символы в NA?

+2

См [страница документации по этой теме] (http://stackoverflow.com/documentation/r/3388/handling-missing-values/11656/basic-usage#t= 201607251849114029215) – Jaap

+2

Определите na.strings при импорте данных. – Roland

+1

См. [Конкретно здесь] (http://stackoverflow.com/documentation/r/3388/handling-missing-values/11657/reading-data-with-na-values#t=201607251914346206181). – Axeman

ответ

1

Создание фрейма данных, df

df <- data.frame(A=c("?",1,2),B=c(2,3,"?")) 
df 
# A B 
# 1 ? 2 
# 2 1 3 
# 3 2 ? 

I. Использование replace() функции

replace(df,df == "?",NA) 
#  A B 
# 1 <NA> 2 
# 2 1 3 
# 3 2 <NA> 

II. При импорте файла с ?

data <- read.table("xyz.csv",sep=",",header=T,na.strings=c("?",NA)) 
data 
# A B 
# 1 1 NA 
# 2 2 3 
# 3 3 4 
# 4 NA NA 
# 5 NA NA 
# 6 4 5 
+0

Первая часть уже упоминалась в другом ответе. – Jaap

+0

О, хорошо, я удалю его. Спасибо. –

4

Кадры данных. Возможно, вам придется возиться с кавычками. Я не тестировал это.

df[df == "?"] <- NA