Я создал Series
из DataFrame
, когда я повторно создаются некоторые данные с числом как так: где H2
является DataFrame
:Панды сбросить индекс на серии, чтобы удалить мультииндексные
H3=H2[['SOLD_PRICE']]
H5=H3.resample('Q',how='count')
H6=pd.rolling_mean(H5,4)
Это дало ряд, который выглядит как это:
1999-03-31 SOLD_PRICE NaN
1999-06-30 SOLD_PRICE NaN
1999-09-30 SOLD_PRICE NaN
1999-12-31 SOLD_PRICE 3.00
2000-03-31 SOLD_PRICE 3.00
с индексом, который выглядит как:
MultiIndex
[(1999-03-31 00:00:00, u'SOLD_PRICE'), (1999-06-30 00:00:00, u'SOLD_PRICE'), (1999-09-30 00:00:00, u'SOLD_PRICE'), (1999-12-31 00:00:00, u'SOLD_PRICE'),.....
Я не хочу, чтобы второй столбец был индексом. В идеале у меня бы был DataFrame
, а столбец 1 - как «Дата» и столбец 2 как «Продажи» (отбрасывание второго уровня индекса). Я не совсем понимаю, как перенастроить индекс.
Просто замечание общего порядка: именовании переменных с указанием номера заказа, в котором вы используете их является путь к катастрофе. Рассмотрим патологический случай, когда 'pandas' не имел' DataFrame' или 'Series', и они были просто названы' DataStructure1' и 'DataStructure2', и все их методы были просто названы' method1', 'method2' и т. Д. , Предоставление вашим переменным значимых имен сделает ваш код разборчивым для других, читающих его в первый раз. Предоставление значимых имен вашим переменным также позволяет * вы * вернуться к вашему коду через месяц и быстро вернуться к скорости. –
Хороший совет, Еще раз спасибо – dartdog