Я читаю большой файл в python по строкам с помощью readline()
. После достижения близко к 672,280 линий я получаю сообщение об ошибке:Ошибка декодирования Unicode Python для байта не в файле
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xfd in position 228:
invalid start byte.
Однако я искал файл, используя grep
для байта 0xfd
и не вернулся ни один. Я также написал код c++
, чтобы просмотреть файл и искать байты 0xfd
и до сих пор ничего не получил. Поэтому я понятия не имею, что здесь происходит. Это ошибка, потому что файл слишком большой?
Я просто не вижу, как может произойти ошибка декодирования для байта не в файле.
Благодаря
Возможный дубликат [Запись UTF-8 строку в моих питона файлов] (http://stackoverflow.com/questions/4812186/writing-utf-8-string-inside-my-python-files) –