Обновление: Если кому-то интересно, оба ответа работают. Они оба получат сводную таблицу, как и вы создавали бы, если бы имитировали Sumifs в Excel. Это именно то, что я искал. Еще раз спасибо вам обоим.Графический процент от целого на основе нескольких критериев
У меня есть фрейм данных (df), который выглядит примерно так, но с большим количеством продуктов. df$Yr
основан на дату отсечки> = 3/2012
Product Classif Yr Revenue
a paid_yes TRUE 25
a paid_yes TRUE 20
a paid_yes TRUE 35
a paid_yes FALSE 20
a paid_yes FALSE 30
a paid_yes FALSE 30
a paid_partial TRUE 15
a paid_partial TRUE 15
a paid_partial FALSE 18
a leased TRUE 12
a leased TRUE 12
a leased FALSE 14
a Other TRUE 27
a Other FALSE 30
a Other TRUE 25
a Other FALSE 22
a Other TRUE 32
a Other FALSE 30
a Other TRUE 24
a Other FALSE 27
b paid_yes TRUE 45
b paid_yes FALSE 32
b paid_yes TRUE 35
b paid_yes FALSE 39
b paid_partial FALSE 42
b paid_partial FALSE 45
b paid_partial TRUE 47
b paid_partial FALSE 33
b paid_partial FALSE 28
b leased TRUE 48
b leased FALSE 46
b leased FALSE 45
b leased TRUE 37
b leased FALSE 33
b leased TRUE 46
b leased FALSE 44
b Other TRUE 49
b Other FALSE 45
b Other TRUE 43
b Other FALSE 39
Я пытаюсь сделать фаска график рассеяния, побочный продукт (а, б, в и т.д.). Я хочу, чтобы моя ось y была df$Classif
, а ось x составляла в общей сложности Revenue
по Product
, в пределах каждого Yr
. Или, другими словами, какой процент от общей выручки от продукта за определенный год составляет каждый классификационный аккаунт?
Я хочу, чтобы мое резюме кадра выглядеть примерно так ...
Product Classif Yr perc.rev
a paid_yes TRUE .332
a paid_partial TRUE .123
a leased TRUE .099
a Other TRUE .446
Где каждый perc.rev добавляет до 100% дали Product
, Classif
и Yr
Я попытался получить мой набор сводных данных/столбец со следующим кодом:
df.perc <- ddply(df, .(Product, Classif, Yr), summarise,
perc.rev = sum(Revenue)/count(Classif))
Полученный кадр данных дает мне средний доход Product
, Classif
, и Yr
. Что мне нужно процента дохода, порождённая Classif
, по сравнению с ALL Classif
- по Product
и Year
Я уверен, что я просто нужна помощь с моей perc.rev формулой или раздел .variables
ddply
. Я привык к Excel и обычно использовал 2 формулы sumifs, но не уверен, как выразить то, что мне нужно сделать здесь, в функции R.
Приведен ли пример из этих данных? Если да, то как вы точно вычислили 0,332 (a, paid_yes, TRUE)? –
Я создал набор данных, расположенный сверху, а затем вычислил кадр вывода/сводной информации в Excel с помощью sumifs. :) Я на самом деле нажал на 2 в .332 – wesmantooth
Но какими будут числа и операции ... Я не вижу, где это .332 произошло из –