Я пытаюсь разделить одну переменную «символ» в моем ядре данных на переменные «множитель».Разделить столбец на несколько двоичных фиктивных столбцов
> sampledf=data.frame(vin=c('v1','v2','v3'),features=c('f1:f2:f3','f2:f4:f5','f1:f4:f5'))
> sampledf
vin features
1 v1 f1:f2:f3
2 v2 f2:f4:f5
3 v3 f1:f4:f5
> desireddf=data.frame(vin=c('v1','v2','v3'),f1=c(1,0,1),f2=c(1,1,0),f3=c(1,0,0),f4=c(0,1,1),f5=c(0,1,1))
> desireddf
vin f1 f2 f3 f4 f5
1 v1 1 1 1 0 0
2 v2 0 1 0 1 1
3 v3 1 0 0 1 1
Я попытался с помощью strsplit()
отделить «особенность» колонкам
strsplit(as.character(df$features), ";")
, но не имел никакой удачи факторизации их.
Они отлично работают, акрун! Но есть ли способ сделать это, используя базовые функции? – outlier123
@ outlier123 добавлен базовый вариант R. – akrun
потрясающий! Большое спасибо Akrun !! (Rep слишком низко, чтобы публично публиковать) – outlier123