Я думаю, что определение проблемы довольно просто, но я ищу решение, подходящее для очень большого набора данных (20+ миллионов).Python: усреднение данных таймсеров в ящиках заданной продолжительности
У меня есть два списка: stamps
, содержащие N
временные метки и values
содержащие N
скалярные значения.
Я могу легко построить эти данные, чтобы иметь график времени.
Теперь я хотел бы рассчитать среднее значение values
, выровненное в 1-минутный лоток (обычно у меня 50 значений в минуту, но бывает, что некоторые пустые). Пустые значения, приводящие к пустым ячейкам, должны сделать среднее значение этого бина равным нулю.
Как я мог эффективно сделать это с минимальным кодом?
Я попытаюсь опубликовать начальное частичное решение в вопросе как можно скорее. –
Что вы хотите сделать с пустыми значениями? Относитесь к ним как к 0 и все еще в среднем более 50? Или среднее значение (num per bin - num empty)? – Simon
Пустые значения, приводящие к пустым ячейкам, должны сделать среднее значение этого бункера равным нулю. –