2016-05-09 4 views
0

Я провел анкетирование, в котором некоторые ответы были «Я не знаю» и «Я не хочу отвечать». Теперь мне нужно изменить те варианты ответа на «Н/Д», чтобы они не учитывались в статистических аналогах. Как мне это сделать?Изменение значения до N/A в Rstudio

ответ

0

Это довольно легко выполнить. Я делаю некоторые предположения относительно ваших данных, так как вы не предоставили формат. Давайте предположим, что у вас есть ваши данные в электронную таблицу первенствовать и вы импортировали его в R с помощью следующего кода:

## Import Data ## 
require("gdata") 
myData <-read.xls("myData.xlsx", stringsAsFactors = FALSE) 

Хорошо, теперь у вас есть кадр данных в R называется myData. Предположим, что есть столбец с именем Answers, который содержит ответы как строки. У нас есть хорошие ответы, некоторые значения NA, а некоторые, которые говорят «Я не знаю», или «Я не хочу отвечать» или тому подобное.

Этот код изменит любые ответы, которые начинаются с «Я не» до NA.

myData$Answers[startsWith(myData$Answers,"I don't")] <- NA 

Или вы могли бы указать ответить на каждый NA индивидуально
(например, если есть некоторые хорошие ответы, которые начинаются с «я не»).

myData$Answers[myData$Answers == "I don't know")] <- NA 
myData$Answers[myData$Answers == "I don't want to answer")] <- NA 

Или вы можете изменить все ответы, которые содержат определенную фразу в любом месте в своем ответе на NA

myData$Answers[grepl("don't know", myData$Answers)] <- NA 

Если вы импортировали строки в качестве факторов, то приведенный выше код будет меняться следующим образом:

myData$Answers[grepl("don't know", levels(myData$Answers))] <- NA 
Смежные вопросы