2016-04-14 3 views
0

Я столкнулся с нелепой ситуацией. Для решения проблемы не хватает данных, я использовал этот код:Обработка отсутствующих данных в R

fixed_data <- fetch_data[-which(! complete.cases(train_sample)),] 
train_index <- sample(1:nrow(fixed_data), size = .7*nrow(fixed_data)) 
train_sample <- fixed_data[train_index, ] 
test_sample <- fixed_data[-train_index,] 

Затем я проверяю строки порционных данных, чтобы убедиться, что нет отсутствующее значение, но по-прежнему отсутствует значение!

length(which(! complete.cases(fixed_data))) 
+0

Определите «недостающие данные», это пустой, NA, некоторая другая символьная строка, обозначающая отсутствие? Если они NA, вы можете использовать 'is.na()' для поиска строк, содержащих NA. Насколько я знаю, строки символов NA не будут считаться отсутствующими на 'complete.cases(). Так что это может быть проблемой. – Badger

+1

Не проблема связана, но '-which (! ...)' очень уродливо. Гораздо лучше просто 'which (...)'. Вы должны предоставить свои данные, иначе как кто-то может помочь? – nicola

+0

Я использую, чтобы удалить все, что он считает не полным, и после этого он по-прежнему рассматривает некоторые другие строки как незавершенные. Это проблема! –

ответ

0

Я изменил код

fixed_data <- fetch_data[which(complete.cases(fetch_data)),] 

И теперь он работает. Какая глупая ошибка!

Смежные вопросы