У меня есть временной ряд из нескольких дней с 1-минутными данными и хотелось бы усреднить его по всем дням по времени суток.Ускоренный способ группового времени суток в пандах
Это очень медленно:
from datetime import datetime
from pandas import date_range, Series
time_ind = date_range(datetime(2013, 1, 1), datetime(2013, 1, 10), freq='1min')
all_data = Series(randn(len(time_ind)), time_ind)
time_mean = all_data.groupby(lambda x: x.time()).mean()
займет почти минуту бежать!
Хотя что-то вроде:
time_mean = all_data.groupby(lambda x: x.minute).mean()
занимает лишь доли секунды.
Есть ли более быстрый способ группировки по времени суток?
Любая идея, почему это так медленно?
dt.time не оптимизирован пандами. Требуется много времени, чтобы преобразовать pandas TimeSeries в массив datetime.time. – waitingkuo