2016-01-12 2 views
0

Я читаю большой файл в python по строкам с помощью readline(). После достижения близко к 672,280 линий я получаю сообщение об ошибке:Ошибка декодирования Unicode Python для байта не в файле

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xfd in position 228: 
invalid start byte. 

Однако я искал файл, используя grep для байта 0xfd и не вернулся ни один. Я также написал код c++, чтобы просмотреть файл и искать байты 0xfd и до сих пор ничего не получил. Поэтому я понятия не имею, что здесь происходит. Это ошибка, потому что файл слишком большой?

Я просто не вижу, как может произойти ошибка декодирования для байта не в файле.

Благодаря

+0

Возможный дубликат [Запись UTF-8 строку в моих питона файлов] (http://stackoverflow.com/questions/4812186/writing-utf-8-string-inside-my-python-files) –

ответ

0

вы можете попробовать открыть файл с кодировкой ISO.

open('myfile.txt', encoding = "ISO-8859-1")