Мне нужно удалить все виды дат (mm-dd-yy
, mm/dd/yyyy
, dd.mm.yy
, dd-Mon-yyyy
и т.д.) из .csv
файла с помощью панд dataframe. Может ли метод фильтра использоваться?фильтр датируется dataframe
for col in df.columns.values:
pd.filter(regex = '(([1-9]|1[012])[-/.]([1-9]|[12][0-9]|3[01])[-/.](19|20)\d\d)|((1[012]|0[1-9])(3[01]|2\d|1\d|0[1-9])(19|20)\d\d)|((1[012]|0[1-9])[-/.](3[01]|2\d|1\d|0[1-9])[-/.](19|20)\d\d)')
например: Если у меня есть .csv
файл с различными колонками с некоторыми данными и датами, как 10/12/2015
, 12/01/1995
, 2016-19-04
, 19th April,2016
и т.д., выходной файл не должен содержать даты.
Sample Data
column1 column2 column3
data 4th April,2016 data
4/20/2016 20-04-16 20.04.2016
data data 20-04-2016
4-Apr-16 data 20/04/2016
, как вы можете видеть, у меня есть различные форматы дат здесь. Мне нужно их удалить.
вашей попытку, пожалуйста – rock321987
окры в df.columns.values: pd.filter (регулярное выражение = «(([1-9] | 1 [012 ]) [- /] ([1-9] |. [12] [0-9] | 3 [01]) [- /] (19 |. 20) \ д \ г) | ((1 [012] | 0 [1-9]) (3 [01] | 2 \ д | 1 \ д | 0 [1-9]) (19 | 20) \ д \ г) | ((1 [012] | 0 [1 -9]) [- /.] (3 [01] | 2 \ d | 1 \ d | 0 [1-9]) [- /.] (19 | 20) \ d \ d) ') –
, но это throws AttributeError: объект 'module' не имеет атрибута 'filter' –