Я пытаюсь прочитать файл с датами в формате (UK) 13/01/1800, однако некоторые даты датируются 1667 годом, которые не могут быть представлены наносекундой временная метка (см. http://pandas.pydata.org/pandas-docs/stable/gotchas.html#gotchas-timestamp-limits). Я понимаю, что с этой страницы мне нужно создать свой собственный PeriodIndex для покрытия диапазона, который мне нужен (см. http://pandas.pydata.org/pandas-docs/stable/timeseries.html#timeseries-oob), но я не могу понять, как преобразовать строку в csv-ривере в дату в этом индексе indexindex.Чтение CSV-файла в Pandas с историческими датами
До сих пор у меня есть:
span = pd.period_range('1000-01-01', '2100-01-01', freq='D')
df_earliest= pd.read_csv("objects.csv", index_col=0, names=['Object Id', 'Earliest Date'], parse_dates=[1], infer_datetime_format=True, dayfirst=True)
Как применить срок до даты считывания/преобразователя, поэтому я могу создать столбец PeriodIndex/DateTimeIndex в dataframe?
Я думаю, что лучше всего загружать и стирать косые черты, тогда вы можете использовать метод в этой ссылке для создания periodindex, поэтому после загрузки выполните 'df ['Самая ранняя дата'] = df ['Самая ранняя дата' ] .str.replace ('\\', '') 'поэтому я не буду передавать параметр parse_dates' в' read_csv', чтобы читать эти значения в виде строк – EdChum