Я испытываю довольно странное поведение функции повторной выборки временного ряда pandas (Python). Я использую последнюю версию панд (0.12.0)Странное поведение передискретизации pandas
Возьмите следующие временные ряды:
dates = [datetime(2011, 1, 2, 1), datetime(2011, 1, 2, 2), datetime(2011, 1, 2, 3),
datetime(2011, 1, 2, 4), datetime(2011, 1, 2, 5), datetime(2011, 1, 2, 6)]
ts = Series(np.arange(6.), index=dates)
Тогда попробуйте передискретизации в 66s и 65s. Это результат, который я получаю:
In [45]: ts.resample('66min')
Out[45]:
2011-01-02 01:00:00 0.5
2011-01-02 02:06:00 2.0
2011-01-02 03:12:00 3.0
2011-01-02 04:18:00 4.0
2011-01-02 05:24:00 5.0
Freq: 66T, dtype: float64
In [46]: ts.resample('65min')
Out[46]:
2011-01-02 01:00:00 0
2011-01-02 02:05:00 NaN
2011-01-02 03:10:00 NaN
2011-01-02 04:15:00 NaN
2011-01-02 05:20:00 NaN
2011-01-02 06:25:00 NaN
Freq: 65T, dtype: float64
Я действительно понимаю поведение при повторной дискретизации до 66 с. Он всегда принимает среднее значение (по умолчанию) всех значений в соответствующем интервале. Я не понимаю и не знаю, как влиять на поведение за 65 лет.
Это упрощенная проблема. Фоном является более сложный процесс коррекции данных, включающий повторную выборку.
Любые идеи?
Вы должны выбрать 'fill_method'. Что бы вы хотели получить в результате? –