У меня есть рамка данных pandas, которая имеет столбец даты, который должен иметь формат '2016-01-17'.Оптимизируйте функцию проверки строки для фрейма данных pandas?
Иногда даты являются нежелательными и могут выглядеть примерно как «0-1274753-3», и я хотел бы удалить эти строки.
Моя попытка состояла в том, чтобы определить функцию, чтобы проверить, является ли строка датой, а затем применить ее к каждой записи в столбце, выкинув строки, которые терпят неудачу. Это медленный процесс по большому кадру данных, и я надеюсь найти лучшее решение.
Текущая попытка выглядит следующим образом:
from dateutil.parser import parse
def is_date (string):
try:
parse (string)
return True
except ValueError:
return False
df = df [df.datecol.apply(is_date)]