Я использую Pandas для хранения данных о ценах акций с использованием фреймов данных. В наборе данных имеется 2940 строк. Снимок Dataset отображается ниже: данныеЗаполните пропущенные значения даты в столбце Dataframe Pandas
временные ряды не содержат значения в субботу и воскресенье. Следовательно, пропущенные значения должны быть заполнены.
Вот код, который я написал, но это не решает проблему:
import pandas as pd
import numpy as np
import os
os.chdir('C:/Users/Admin/Analytics/stock-prices')
data = pd.read_csv('stock-data.csv')
# PriceDate Column - Does not contain Saturday and Sunday stock entries
data['PriceDate'] = pd.to_datetime(data['PriceDate'], format='%m/%d/%Y')
data = data.sort_index(by=['PriceDate'], ascending=[True])
# Starting date is Aug 25 2004
idx = pd.date_range('08-25-2004',periods=2940,freq='D')
data = data.set_index(idx)
data['newdate']=data.index
newdate=data['newdate'].values # Create a time series column
data = pd.merge(newdate, data, on='PriceDate', how='outer')
Как заполнить недостающие значения в субботу и воскресенье?
При использовании bfill() .reset_index(), отображается следующее TypeError: Onl y действителен с DatetimeIndex, TimedeltaIndex или PeriodIndex, но получил экземпляр «RangeIndex» – User456898
Вам нужно установить индекс из столбца «PriceDate» - 'data.set_index ('PriceDate', inplace = True)'. – jezrael
Спасибо, теперь он отлично работает! – User456898