У меня возникли проблемы с выбором данных в кадре данных в зависимости от часа.Выбор данных в течение одного часа в таймсере данных
У меня есть данные за несколько месяцев, которые увеличиваются с интервалом в 10 минут.
Я хотел был бы иметь возможность выбрать данные (создавая другой dataframe) для каждого часа в определенный день для каждого часа. Однако мне трудно создавать выражение.
Это, как я это сделал, чтобы выбрать день:
x=all_data.resample('D').index
for day in range(20):
c=x.day[day]
d=x.month[day]
print data['%(a)s-%(b)s-2009' %{'a':c, 'b':d} ]
, но если я сделаю это за час, он не будет работать.
x=data['04-09-2009'].resample('H').index
for hour in range(8):
daydata=data['4-9-2009 %(a)s' %{'a':x.hour[hour]}]
Я получаю ошибку:
raise KeyError('no item named %s' % com.pprint_thing(item))
KeyError: u'no item named 4-9-2009 0'
, которое истинно, как в формате дд/мм/YYY чч: мм: сс
Я уверен, что это должно быть легко и что-то делать с повторной выборкой. Беда в том, я не хочу ничего делать с ДАТ, просто выбрать фрейм данных (соотнести его впоследствии)
Приветствия
ahh благодарит alot! это объясняет некоторую путаницу, которую я испытываю с индексацией в пандах. Одна небольшая проблема, которую я имею, заключается в том, что если вы не ставите '0' в, как говорят: daydata = data.loc ['4-9-2009 0% (a) s'% {'a': hour}]' Я получаю сообщение об ошибке. Есть ли способ заставить нуль? –
@AshleighClayton посмотреть мои правки –