Там есть таблица данных представлена следующим образом:выдержки из классов данных времени и построить временные ряды
timestamp id
785340 2016-04-01 00:01:19.000 4624
785341 2016-04-01 00:01:19.000 4624
785342 2016-04-01 00:02:20.000 4624
794012 2016-04-01 00:02:21.000 4624
18866 2016-04-01 00:02:28.142 4769
794198 2016-04-01 00:03:31.000 4624
18906 2016-04-01 00:03:40.130 4648
18907 2016-04-01 00:04:40.155 4648
18908 2016-04-01 00:05:40.157 4648
797062 2016-04-01 00:05:48.000 4624
В таблице есть два столбца: временная метка и идентификатор. Столбец timestamp генерируется с использованием df.table$timestamp<-as.POSIXct(df.table$timestamp)
Первый столбец просто представляет номер строки в исходной таблице, так как я повторно заказал таблицу на основе метки времени.
Прямо сейчас, я хочу подсчитать количество идентификаторов за заданную минуту, например, 1-я минута имеет 2 идентификатора; 2-я минута имеет 3 идентификатора и т. д. Другими словами, я хочу извлечь минутную информацию из метки времени. Цель состоит в том, чтобы построить временной ряд с одной минутой в качестве интервала, количество идентификаторов, расположенных в пределах этого интервала в 1 минуту, является значением. Есть ли эффективный способ сделать это? Благодарю.
Это секунды, а не минуты. – akrun
Не уверен, что минимальный интервал основан на всех датах или зависит от даты. Если дата специфична, тогда «aggregate (id ~ timestamp, data = transform (df.table, format (timestamp,«% Y-% m-% d% H:% M »)), FUN = длина)' – akrun
I просто покажите подраздел данных. Он может включать два месяца. Поэтому будет 60 * 24 * 30 * 2 минуты. Благодарю. – user288609