У меня есть база данных заказов для онлайн-платформы для покупок.Выполнение подсчета внутри групп в dataframe
Таблица, с которой я работаю, выглядит так: каждая строка соответствует одному клиенту/пункту/дате.
OrderHistory <- data.frame(date=c("2015-02-01", "2015-03-01", "2015-04-01", "2015-03-01", "2015-04-01", "2015-05-01", "2015-05-01"),
customer=c("A","A","A","B","B","B","B"),
item=c("Candy", "Coffee", "Coffee", "Candy", "Candy", "Candy", "Coffee"))
То, что я хотел бы получить это текущий счет числа каждого члена заказал конкретный пункт, так что я могу запустить анализ, на котором элементы упорядочены повторно одними и теми же клиентами и какие из них заказали один раз и никогда больше.
Выходной сигнал будет выглядеть
out <- data.frame(date=c("2015-02-01", "2015-03-01", "2015-04-01", "2015-03-01", "2015-04-01", "2015-05-01", "2015-05-01"),
member=c("A","A","A","B","B","B","B"),
item=c("Candy", "Coffee", "Coffee", "Candy", "Candy", "Candy", "Coffee"),
count=c(1,1,2,1,2,3,1))
Я хотел бы решение dplyr, но я открыт для любых предложений! Точные элементы на платформе постоянно меняются, поэтому решение должно быть динамичным для учета этого.
Amazing. Такое элегантное простое решение. Благодаря! – SFuj