Предположим, что я собрал образец продаж гаража, в этом образце есть столбец с названием «Дополнительное описание» и из-за его необязательного характера, некоторые записи пусты, а другие заполнены. Если бы я превратил это в колонку факторов, у меня было бы около пяти тысяч разных уровней. Вместо этого я предпочел бы знать, помогает ли «дополнительное описание» продать гараж или нет.Как преобразовать столбец со многими разными строками в столбец с двумя уровнями?
Из-за этого я хочу превратить пустые строки в атрибут фактора «N» и непустые строки в атрибут фактора «Y». Итак, каким образом я могу преобразовать данные по своему вкусу?
Пример:
Как данные выглядят:
str(data)
$ Additional Description: chr NA NA NA "New Products" "Outdoor Sale" ...
Как я хочу, чтобы данные выглядеть:
str(data)
$ Additional Description: Factor w/ 2 levels "N","Y": 1 1 1 1 1 1 1 1 1 1 ...
Пожалуйста, дайте пример данных и ожидаемых результатов. http://stackoverflow.com/help/mcve – effel
'df $ newcol <- is.na (df $ дополнительная_description)' или, может быть, 'df $ newcol <- df $ дополнительная_description ==" "' или, может быть, что-то еще. Трудно сказать без примера. – cory
Вам необходимо разместить данные в вопросе, а не по ссылке, а также по загрузке или картинке. Пожалуйста, прочитайте [ask] и [mcve], а затем соответствующим образом отредактируйте свой вопрос. Кроме того, этот вопрос не имеет ничего общего с RStudio, поэтому, пожалуйста, не добавляйте к нему тег. –