Я работаю с большим набором данных, пример может быть показан ниже. Для большинства отдельных файлов мне придется обрабатывать данные, которые должны быть более одного дня.Подмножество данных по большинству ежедневных записей
Date <- c("05/12/2012 05:00:00", "05/12/2012 06:00:00", "05/12/2012 07:00:00",
"05/12/2012 08:00:00", "06/12/2012 07:00:00", "06/12/2012 08:00:00",
"07/12/2012 05:00:00", "07/12/2012 06:00:00", "07/12/2012 07:00:00",
"07/12/2012 08:00:00")
Date <- strptime(Date, "%d/%m/%Y %H:%M")
c <- c("0","1","5","4","6","8","0","3","10","6")
c <- as.numeric(c)
df1 <- data.frame(Date,c,stringsAsFactors = FALSE)
Я хочу только оставить данные в течение одного дня. Этот день будет выбран с учетом максимального количества точек данных за этот день. Если по какой-либо причине привязаны два дня (с максимальным количеством точек данных), я хочу выбрать день с самым высоким индивидуальным значением, записанным.
В приведенном выше примере данных, я остался с 7 декабря. Он имеет 4 точки данных (как и 5 декабря), но имеет самое высокое значение, записанное за эти два дня (т. Е. 10).