Я использую R в первый раз. У меня есть следующий набор данных (макет очень большой набор данных, который я на самом деле работаю с):Получение количества данных в R
Type Date Size Color
L shape 2008-04-14 161 blue
L shape 2010-10-16 654 yellow
L shape 2005-07-03 149 blue
L shape 2006-08-16 657 yellow
L shape 2007-04-08 229 yellow
L shape 2004-03-17 784 green
Y shape 2014-02-22 917 pink
Y shape 2012-05-04 186 green
Y shape 2006-11-25 641 yellow
Y shape 2015-09-07 493 blue
Y shape 2011-07-06 953 green
Я хотел бы получить назад количество occurrances каждого цвета для каждого типа, то даты каждый тип и мин, макс и средний для размера для каждого типа. Вывод должен выглядеть следующим образом:
Type Colors Dates Mean Size Min Size Max Size
L shape 3 2008-04-14 439 149 784
2010-10-16
2005-07-03
2006-08-16
2007-04-08
2004-03-17
Y shape 4 2014-02-22 638 186 953
2012-05-04
2006-11-25
2015-09-07
2011-07-06
Это то, что я сделал до сих пор:
cat <- big_catalog
na.rm = TRUE
library(plyr)
mydata <-ddply(cat, c("Type", "Date", "Size", "Color"), summarize,
Colors = length(Color),
Dates = (Date),
Mean_Size = mean(Size),
Minimum_Size = min(Size),
Maximum_Size = max(Size)
)
Но я в конечном итоге с этим:
Type Date Size Color Colors Dates Mean Size Min Size Max Size
L shape 2008-04-14 161 blue 2 2008-04-14 161 161 161
L shape 2010-10-16 654 yellow 3 2010-10-16 654 654 654
L shape 2005-07-03 149 blue 2 2005-07-03 149 149 149
L shape 2006-08-16 657 yellow 3 2006-08-16 657 657 657
L shape 2007-04-08 229 yellow 2 2007-04-08 229 229 229
L shape 2004-03-17 784 green 1 2004-03-17 784 784 784
Y shape 2014-02-22 917 pink 1 2014-02-22 917 917 917
Y shape 2012-05-04 186 green 2 2012-05-04 186 186 186
Y shape 2006-11-25 641 yellow 1 2006-11-25 641 641 641
Y shape 2015-09-07 493 blue 1 2015-09-07 493 493 493
Y shape 2011-07-06 953 green 2 2011-07-06 953 953 953
я, видимо, нужно перебрать это, но я очень новичок в R, и я не понимаю, как это сделать.
Не группу по каждой колонке, только группа в 'столбце type'. (Так как вы хотите, чтобы все было сделано «для каждого типа».) Хотя ваш запрос «Date» должен быть многострочным, где все остальное однострочно усложняет вопросы ... – Gregor