Ниже приведен пример данных, которые у меня есть.Получить совокупную сумму данных по дням и часам
date time size filename day.of.week
1 2015-01-16 5:36:12 1577 01162015053400.xml Friday
2 2015-01-16 5:38:09 2900 01162015053600.xml Friday
3 2015-01-16 5:40:09 3130 01162015053800.xml Friday
Что я хотел бы сделать, это суммировать размер файлов за каждый час.
Я хотел бы результирующую таблицу данных, которая выглядит как:
date hour size
2015-01-16 5 7607
2015-01-16 6 10000
так далее, и так далее.
Но я, похоже, не могу получить вывод, который мне нужен.
Я пробовал ddply и aggregate, но я суммирую весь день, я не уверен, как сломать его по часам в столбце времени.
И у меня есть данные за несколько дней. Так что это не только на этот день. Это с того дня, почти каждый день до вчерашнего дня.
Спасибо!
Либо) вы ** [использовать соединение group_by выражение] (http://stackoverflow.com/questions/24573485/calculate-hourly-means-in-r-based-on-multiple-conditions?rq=1) ** (в этом случае я рекомендую dplyr), иначе b) вы ** [конвертируете отдельные, даты + поля времени в объект datetime] (http://stackoverflow.com/questions/8985124/how-to-create-a-datetime-object-from-separate-date-fields) **. В любом случае, это дубликат. Как только вы уточните, что вы предпочитаете, это должно быть закрыто как дублирующее. Моя рекомендация - dplyr с составным выражением group_by, она эффективна и чиста. – smci