2015-08-10 3 views
0

Я использую следующий код, чтобы прочитать файл csv в dataframe. Тем не менее, я получаю ошибку pandas.parser.CParserError: Error tokenizing data. C error: Expected 1 fields in line 4, saw 2, и поэтому я изменил pd.read_csv('D:/TRYOUT.csv') на pd.read_csv('D:/TRYOUT.csv', error_bad_lines=False) как предложено here. Однако теперь я получаю ошибку UnicodeDecodeError: 'utf-8' codec can't decode byte 0xf0 in position 1: invalid continuation byte в той же строке.UnicodeDecodeError при чтении CSV-файла в Dataframe

def ExcelFileReader(): 
    mergedf = pd.read_csv('D:/TRYOUT.csv', error_bad_lines=False) 
    return mergedf 

Спасибо

+0

Не могли бы вы предоставить пример CSV-файла, который вызывает сбой? – Plasma

ответ

1

Если вы на Windows, вам, вероятно, нужно использовать pd.read_csv(filename, encoding='latin-1')

0

У меня была аналогичная проблема, и пришлось использовать

utf-8-sig 

как кодирование,

Причина, по которой я использовал utf-8-sig, состоит в том, что если вы когда-либо получаете нелатинский язык персонажи, с которыми он не справится правильно. Есть несколько способов обойти проблему, но я думаю, вы можете просто выбрать лучшее, что соответствует вашим потребностям.

Надеюсь, что это поможет.

Смежные вопросы