2014-05-14 1 views
0

я загрузить CSV с помощью df=pd.to_csv(file, header = 0) и у меня есть две колонки, Date и Time, в этих формате: 20120718 (ГГГГММДД) и 15:59:56.319000 (Н: M: S :МИЗ).Python: Назначение временных меток в dataframe с использованием отдельных значений даты и времени в наборе данных

Как я могу объединить оба для того, чтобы установить индекс данных df с использованием столбцов этой даты и временных меток и иметь правильный индексный ряд времени?

ответ

1
df.sort_index(by=['Date', 'Time'], inplace=True) 
df.index = np.arange(1, len(df) + 1) 

Это самый простой способ. Если вам действительно нужен временной ряд в качестве индекса, то:

df['timeseries'] = pd.to_datetime(df.Date + ' ' + df.Time, unit='ms') 
+0

спасибо, но df.Date находится в 'int'. Поэтому я использую ваш код выше: 'df ['timeseries'] = pd.to_datetime (df.Date + '' + df.Time, unit = 'ms')' и добавить 'str' в df.Date он завинчивает все , – Plug4

+1

Вы правы, это не работает как int. Я думал, что это строка. Попробуйте '(df.Date.astype (str) + '' + df.Time, unit = 'ms')' – zerovector

Смежные вопросы