Я пытаюсь прочитать большой файл в r. При попытке прочитать это происходит. Даже когда я пропускаю первые 800607 строк, он не исчезает. Я также попытался удалить строку в терминале с помощью команды.Пропустить строки/строки, которые создают ошибки в fread R
sed '800608d' filename.csv
Это не решило мою проблему. Я был бы очень признателен, если бы вы могли мне помочь.
оригинальная ошибка я получил от R является:
> data<-fread("filename.csv")
Read 2.0% of 34143409 rows
Error in fread("filename.csv") :
Field 16 on line 800607 starts with quote (") but then has a problem. It can contain balanced unescaped quoted subregions but if it does it can't contain embedded \n as well. Check for unbalanced unescaped quotes: """The attorney for Martin's family, Benjamin Crump, says the evidence is ""irrelevant\"""" """".","NULL","NULL","NULL","NULL","NULL","NULL","NULL","Negative"
In addition: Warning message:
In fread("filename.csv") :
Starting data input on line 8 and discarded previous non-empty line: done
Это очень сложный вопрос. Проблема заключается в том, что у вас есть столбец в вашем файле, который использует те же специальные символы, что и структура файла («для цитирования», «как разделитель и т. Д.»), Поэтому он полностью испортил формат файла. Идеальным способом было бы измените формат файла, если у вас есть доступ к исходному файлу, например, установите символ кавычки по умолчанию как «вместо». В противном случае было бы полезно предоставить фактический файл, чтобы мы могли также взглянуть на него –
К сожалению, мне не разрешено предоставлять доступ, а изменить формат файла займет много времени. – Carlo