2016-03-18 2 views
-3

Предположим, что я собрал образец продаж гаража, в этом образце есть столбец с названием «Дополнительное описание» и из-за его необязательного характера, некоторые записи пусты, а другие заполнены. Если бы я превратил это в колонку факторов, у меня было бы около пяти тысяч разных уровней. Вместо этого я предпочел бы знать, помогает ли «дополнительное описание» продать гараж или нет.Как преобразовать столбец со многими разными строками в столбец с двумя уровнями?

Из-за этого я хочу превратить пустые строки в атрибут фактора «N» и непустые строки в атрибут фактора «Y». Итак, каким образом я могу преобразовать данные по своему вкусу?

Пример:

Как данные выглядят:

str(data) 
$ Additional Description: chr NA NA NA "New Products" "Outdoor Sale" ... 

Как я хочу, чтобы данные выглядеть:

str(data) 
$ Additional Description: Factor w/ 2 levels "N","Y": 1 1 1 1 1 1 1 1 1 1 ... 
+4

Пожалуйста, дайте пример данных и ожидаемых результатов. http://stackoverflow.com/help/mcve – effel

+0

'df $ newcol <- is.na (df $ дополнительная_description)' или, может быть, 'df $ newcol <- df $ дополнительная_description ==" "' или, может быть, что-то еще. Трудно сказать без примера. – cory

+1

Вам необходимо разместить данные в вопросе, а не по ссылке, а также по загрузке или картинке. Пожалуйста, прочитайте [ask] и [mcve], а затем соответствующим образом отредактируйте свой вопрос. Кроме того, этот вопрос не имеет ничего общего с RStudio, поэтому, пожалуйста, не добавляйте к нему тег. –

ответ

0

Пожалуйста, попробуйте привести пример, когда вы размещаете вопрос. Надеяться вы хотите сделать пустые строки, как «N» и непустых строк, как «Y», то попробуйте следующее:

df$Additional.Description.New[!is.na(df$Additional.Description)] = "Y" 
df$Additional.Description.New[is.na(df$Additional.Description)] = "N" 
Смежные вопросы