2015-12-30 2 views
0

У меня есть CSV-файл, как этотпитон проблема кодирования - utf8 кодирования не работает

Niklas Fagerstr�m http://www.vimeo.com/niklasf 5379549 5379549 
Niklas Fagerstr�m http://fagerstrom.eu/en 5379549 5379549 

Я читала

Niklas Fagerstr�m 
Niklas Fagerstr�m 

Эти два поля так все? символы должны быть закодированы, но мой сценарий не кодирующая

import csv 
import MySQLdb 
import re 
import sys 
reload(sys) 
sys.setdefaultencoding('utf-8') 

with open('finland_5000_rows.csv', 'rb') as csvfile: 
    spamreader = csv.reader(csvfile, delimiter=',', quotechar='|') 
    for row in spamreader: 
     #row[0] = row[0].encode('') 
     one = row[0] 
     print one 

Выход:

Niklas Fagerstr�m 
Niklas Fagerstr�m 

Но я хочу выход как этот

Niklas Fagerström 
Niklas Fagerström 

Какие изменения я должен сделать в коде выше, чтобы ожидать результат?

+0

Сначала я вижу знак вопроса, для первых строк Niklas и т. Д. Когда вы открываете csv, появляется ли вопросительный знак уже? Что происходит, когда вы открываете csv в блокноте, например? – Untitled123

+0

Я нахожусь в Linux, я открылся в gedit, это показывает, как это Niklas Fagerstr m – Mounarajan

+0

Не 100%, но это похоже на то, что для кодировки файлов есть проблемы. – Untitled123

ответ

0

Что я делаю, когда это происходит, скопируйте текст из csv в блокнот ++ и нажмите конвертировать в UTF-8 и сохранить его.