У меня есть большой data.frame, содержащий эти значения:частоты Count и добавьте общую сумму
ID_Path Conversion Lead Path Week
32342 A25177 1 JEFD 2015-25
32528 A25177 1 EUFD 2015-25
25485 A3 1 DTFE 2015-25
32528 Null 0 DDFE 2015-25
23452 A25177 1 JDDD 2015-26
54454 A25177 1 FDFF 2015-27
56848 A2323 1 HDG 2015-27
я хочу, чтобы иметь возможность создать таблицу частот, которая отображает таблицу, как это:
Week Total A25177 A3 A2323
2015-25 3 2 1 0
2015-26 1 1 0 0
2015-27 2 1 0 1
В каждом уникальном Conversion
есть столбец, и все время, когда Conversion
является Null, совпадает с Lead
. В этом примере есть 3 уникальных преобразования, иногда их 1, иногда их 5 или Больше. Так не должно быть ограничено только 3.
Я создал новый DF
, содержащий только Conversion
, которые не Null
Я попытался с помощью data.table
с этим кодом:
DF[,list(Week=Week,by=Conversion]
не повезло.
Я попытался с помощью plyr
с этим кодом:
ddply(DF,~Conversion,summarise,week=week)
не повезло.
Откуда взялось 'A2323' и почему' Total' составляет 5 для этой строки? Мне кажется, что все, что вам нужно, это нечто вроде 'addmargins (таблица (DF [c (« Неделя »,« Конверсия »)]), 2)' –
Или может быть что-то вроде 'reshape2 :: dcast (df, Week ~ Conversion, value.var = "Conversion", marginins = "Conversion") ', все еще не уверен, откуда эти 5 ... –
Ahh Я пропустил это, это должно быть 3, а не 5. A2323 должен был проиллюстрировать, что были больше Точки преобразования, а не только те, которые вы видите в первых 6 строках – KhalidN