У меня есть набор данных переписи с некоторыми недостающими переменными, указанными ?
, При проверке неполных случаев в R это говорит о том, что их нет, потому что R принимает ?
как допустимый символ. Есть ли способ изменить все ?
на NA
? Я хотел бы запустить множественное вменение с использованием пакета мышей, чтобы заполнить недостающие данные после.Как изменить символы в NA?
-1
A
ответ
1
Создание фрейма данных, df
df <- data.frame(A=c("?",1,2),B=c(2,3,"?"))
df
# A B
# 1 ? 2
# 2 1 3
# 3 2 ?
I. Использование replace()
функции
replace(df,df == "?",NA)
# A B
# 1 <NA> 2
# 2 1 3
# 3 2 <NA>
II. При импорте файла с ?
data <- read.table("xyz.csv",sep=",",header=T,na.strings=c("?",NA))
data
# A B
# 1 1 NA
# 2 2 3
# 3 3 4
# 4 NA NA
# 5 NA NA
# 6 4 5
+0
Первая часть уже упоминалась в другом ответе. – Jaap
+0
О, хорошо, я удалю его. Спасибо. –
4
Кадры данных. Возможно, вам придется возиться с кавычками. Я не тестировал это.
df[df == "?"] <- NA
См [страница документации по этой теме] (http://stackoverflow.com/documentation/r/3388/handling-missing-values/11656/basic-usage#t= 201607251849114029215) – Jaap
Определите na.strings при импорте данных. – Roland
См. [Конкретно здесь] (http://stackoverflow.com/documentation/r/3388/handling-missing-values/11657/reading-data-with-na-values#t=201607251914346206181). – Axeman