2015-06-02 2 views
44

Возьмите этого переменный образецR распространение нескольких столбцов с tidyr

df <- data.frame(month=rep(1:3,2), 
       student=rep(c("Amy", "Bob"), each=3), 
       A=c(9, 7, 6, 8, 6, 9), 
       B=c(6, 7, 8, 5, 6, 7)) 

я могу использовать spread из tidyr изменить это широкий формат.

> df[, -4] %>% spread(student, A) 
    month Amy Bob 
1  1 9 8 
2  2 7 6 
3  3 6 9 

Но как я могу распространять два значения, например. как A и B, так что выход что-то вроде

month Amy.A Bob.A Amy.B Bob.B 
1  1  9  8  6  5 
2  2  7  6  7  6 
3  3  6  9  8  7 

ответ

95

Вот можно простое и очень эффективное решения с использованием data.table

library(data.table) ## v >= 1.9.6 
dcast(setDT(df), month ~ student, value.var = c("A", "B")) 
# month Amy_A Bob_A Amy_B Bob_B 
# 1:  1  9  8  6  5 
# 2:  2  7  6  7  6 
# 3:  3  6  9  8  7 

Или возможного tidyr решения

df %>% 
    gather(variable, value, -(month:student)) %>% 
    unite(temp, student, variable) %>% 
    spread(temp, value) 

# month Amy_A Amy_B Bob_A Bob_B 
# 1  1  9  6  8  5 
# 2  2  7  7  6  6 
# 3  3  6  8  9  7 
+0

У меня есть та же проблема, но у меня есть несколько учеников с несколькими записями, A и B в течение нескольких месяцев. Код дает следующую ошибку: Ошибка: Дублировать идентификаторы для строк. Пожалуйста помоги. –

+1

@PolarBear Как вы хотите обращаться с обманами? Вы хотите суммировать? имею в виду? Попробуйте 'data.table' решение и добавьте' fun.aggregate = sum' в 'dcast' –

+0

Я хочу взять медиану обманов с помощью tidyr –

Смежные вопросы