У меня есть dataframe, и я хочу, чтобы удалить некоторые специфические повторяющиеся строки:подвыборкой панды dataframe на основе индекса
import numpy as np
import pandas as pd
nrows = 144
df = pd.DataFrame(np.random.rand(nrows,), pd.date_range('2016-02-08 00:00:00', periods=nrows, freq='2h'), columns=['A'])
dataframe непрерывно со временем, предоставляя данные каждые два часа до бесконечности, но я выбрал чтобы показывать только подмножество для краткости. Я хочу удалить данные каждые 72 часа в 8:00, начиная с понедельника, чтобы совпасть с внешним событием, которое изменяет данные. Для этого моментального снимка данных я хочу удалить строки, индексированные в 2016 году, 02-08 08:00, 2016-02-11 08:00, + 3D и т. Д.
Есть ли простой способ сделать это?
Непонятно, что вы хотите удалить. 36 часов! = 3 дня и 2016-02-08 - не понедельник. – Goyo
В США, 8 февраля 2016 года - понедельник. –
Да, я, должно быть, искал неправильный календарь. Таким образом, вы хотите удалить 2016-02-08 08:00 (первый понедельник), 2016-02-11 08:00 (через 3 дня) и 2016-02-14 08:00 (через 6 дней), а также 2016- 02-15 08:00 (понедельник), а затем перезапустить счет здесь? – Goyo