Как новичок R Я вытягиваю свои волосы, пытаясь отлаживать загадочные ошибки R. У меня есть csv, который содержит 150k строк, которые я загружаю в кадр данных с именем 'date'. Затем я использую lubridate для преобразования этого столбца символов в datetime в надежде найти минимальную/максимальную дату.Найдите даты, которые не могут разобрать в R Lubridate
dates <- csv[c('datetime')]
dates$datetime <- ymd_hms(dates$datetime)
Выполнение этого кода я получаю следующее сообщение об ошибке:
Warning message:
3 failed to parse.
Я принимаю это как CSV может иметь некоторые Janky даты там и следующий пробег:
min(dates$datetime)
max(dates$datetime)
Оба они возвращают NA, что я предполагаю, это из нескольких сломанных дат, которые все еще хранятся в кадре данных. Я искал для быстрого исправления и даже попытался создать цикл foreach, чтобы определить даты проблемы, но не повезло. Что было бы простым способом определить 3 сломанные даты?
example date format: 2015-06-17 17:10:16 +0000
Вы можете проверить, соответствует ли формат. Также проверьте '? Guess_formats' – akrun
Если вы сортируете по вектору datetime, будет ли NA быть либо в голове, либо в хвосте? – lawyeR
@akrun Я попытался сделать это в excel путем импорта csv и проверки длины каждой ячейки и фильтрации для чего-то неуместного. Это ни к чему не привело, есть ли способ сделать это в R? Я попробовал guess_formats & parse_date_time, и оба они потерпели неудачу. –