Я пытаюсь читать CSV/текстовый файл со следующей структурой:Как правильно читать csv с датами и пропущенными ведущими нулями в пандах?
caseid eventdate constype consid employid delta
4044 13/11/1996 9 2301 3044 0
Это то, что я уже знаю:
caseid
,consid
иemployid
8 значные строки (с ведущими нулями что не будет отображаться в текстовом файле)eventdate
является дата дд/мм/ггггcostype
является строкойdelta
поплавкового
Теперь, что синтаксис панды, чтобы правильно прочитать этот CSV/текст, так что все столбцы правильно набранный?
Я использую это:
pd.read_csv(path,
types = {'caseid': np.char,
'eventdate': np.datetime64,
'constype': np.char,
'consid': np.char,
'employid': np.char,
'delta': np.float16})
Но это не может заботиться о датах и ведущих нулей - любые мысли/предложения/помощь будет очень высокую оценку.
он отлично работает - спасибо Ed! Я также добавил синтаксический анализатор даты (по-видимому, автопарсер не справляется с отсутствующими датами и, следовательно, возвращает строку: 'parse_dates = lambda x: date (2020, 1, 1), если x является np.nan else datetime.strptime (ул (х), '% d /% м /% Y') ' – rezakhorshidi