Мне нужно сделать dataframe манекенов из данных опроса, где респонденты заявили слова в нескольких столбцах в кадре данных. Вот упрощенный пример, чтобы проиллюстрировать, что мне нужно сделать? Одно слово здесь представлено письмом.Сделать фиктивные переменные из нескольких столбцов и создать новый dataframe
id <- c(1:6)
v.1 <- c("a","b","d","e","a","c")
v.2 <- c("b","a","a","a","b","a")
v.3 <- c("e","c","b","b","e","b")
df <- data.frame(id,v.1,v.2,v.3)
> df
id v.1 v.2 v.3
1 1 a b e
2 2 b a c
3 3 d a b
4 4 e a b
5 5 a b e
6 6 c a b
Это мой желаемый выход?
> print(df.dummy)
id a b c d e
1: 1 1 1 0 0 1
2: 2 1 1 1 0 0
3: 3 1 1 0 1 0
4: 4 1 1 0 0 1
5: 5 1 1 0 0 1
6: 6 1 1 1 0 0
Любые идеи?
Что представляет v.X? Как вы хотите, чтобы эти сокращения уменьшались до желаемого результата? Вам нужен счет, т. Е. Если строка 'id 1' была' "a", "b", "a" 'вы хотите, чтобы было 2? – MikeRSpencer
содержание в v.X - это одиночные слова, поэтому они являются векторами-символами. – jonas
респонденты могут выбрать только одно слово, поэтому не нужно суммировать или подсчитывать. – jonas