У меня есть временной ряд в объекте dataframe python pandas, и я хочу создать группу на основе индекса, но я хочу, чтобы перекрывающиеся группы группы были не различны. Header_sec является столбцом индекса. Каждая группа состоит из 2-секундного окна. Input dataFramegroupby с интервалами с перекрывающимися интервалами
header_sec
1 17004 days 22:17:13
2 17004 days 22:17:13
3 17004 days 22:17:13
4 17004 days 22:17:13
5 17004 days 22:17:14
6 17004 days 22:17:14
7 17004 days 22:17:14
8 17004 days 22:17:14
9 17004 days 22:17:15
10 17004 days 22:17:15
11 17004 days 22:17:15
12 17004 days 22:17:15
13 17004 days 22:17:16
14 17004 days 22:17:16
15 17004 days 22:17:16
16 17004 days 22:17:16
17 17004 days 22:17:17
18 17004 days 22:17:17
19 17004 days 22:17:17
20 17004 days 22:17:17
Моя первая группа должна иметь
1 17004 days 22:17:13
2 17004 days 22:17:13
3 17004 days 22:17:13
4 17004 days 22:17:13
5 17004 days 22:17:14
6 17004 days 22:17:14
7 17004 days 22:17:14
8 17004 days 22:17:14
Вторая группа начинается с предыдущего индекса и занимает 1/2 записей в предыдущем секунду.
7 17004 days 22:17:14
8 17004 days 22:17:14
9 17004 days 22:17:15
10 17004 days 22:17:15
11 17004 days 22:17:15
12 17004 days 22:17:15
13 17004 days 22:17:16
14 17004 days 22:17:16
Третья группа .....
13 17004 days 22:17:16
14 17004 days 22:17:16
15 17004 days 22:17:16
16 17004 days 22:17:16
17 17004 days 22:17:17
18 17004 days 22:17:17
19 17004 days 22:17:17
20 17004 days 22:17:17
Если я GroupBy по индексу,
dfgroup=df.groupby(df.index)
это дает одну группу в секунду. Что было бы лучшим способом объединить эти группы?
Есть всегда будет 4 записи в секунду? – SO44
Нет, так как отсутствуют данные. Это фактически образцы, собранные в секунду. Фактические данные имеют 100 выборок в секунду, но иногда есть недостающая запись. – AMisra
Примеры в вашем вопросе несовместимы. Вторая группа занимает 2 строки с 22:17:14, но третья группа не берет ни одного из 22:17:15. Первая группа принимает все значения с 22:17:15, но вторая группа не принимает все значения с 22:17:16. Не могли бы вы прояснить? Я думаю, вам нужны все значения из заданного второго + последнего 2 значения из предыдущих секунд + первые 2 значения из следующей секунды. Верный? – Kartik