2015-04-13 3 views
0

Мне нужно проверить модель, применяя временную проверку перекрестных ссылок, оставив последние 5 недель из набора данных.Выбор времени по времени Python

Затем прогнозируйте одну неделю и добавьте неделю к своему образцу один за другим. Запишите MSE и запишите прогноз.

Проблема с датой и временем в файле CSV, который у меня есть, и как удалить последние 5 недель. Dataset:

data = pd.read_csv('https://www.wu.ac.at/usr/ma/nloehndo/dmds/data/pm_25_weather.csv', index_col=0, parse_dates=[0], infer_datetime_format=True) 

ответ

2

Вы можете найти дату, которая за 5 недель до последней даты в индексе, как это:

In [18]: data.index[-1] - pd.DateOffset(weeks=5) 
Out[18]: Timestamp('2015-01-17 23:00:00') 

Затем создать булеву маску

cutoff = data.index[-1] - pd.DateOffset(weeks=5) 
mask = data.index < cutoff 

для разделения данные по двум группам:

train, test = data.loc[mask], data.loc[~mask] 
+0

спасибо, что помогло, но как я могу предсказать одну неделю, а затем рассмотреть ее как функцию на следующей неделе и записать mse и построить ее? –

Смежные вопросы