2014-01-25 2 views
0

Я импортирую из этого корма xml http://www.lnv.fr/xml/ajaccio/calendrier.xml У меня есть некоторые проблемы, потому что некоторые данные, которые я хочу извлечь, имеют французские знаки акцента.проблема с добавлением объекта unicode к списку

url = 'http://www.lnv.fr/xml/ajaccio/calendrier.xml' 
r = requests.get(url) 
soup = BeautifulSoup(r.content) 
matches = soup.findAll('match') 

Когда я делаю это

for match in matches: 
    print match.equipedomicile.string 

Он печатает их, как они должны там нет никаких проблем с командой с диакритическими знаками, как Сет, например.

Но когда я делаю это

def GetGames(): 
homeTeamList = []  
for match in matches: 
    homeTeam = unicode(match.equipedomicile.text)   
    homeTeamList.append(homeTeam) 
return homeTeamList 

и вызвать функцию в списке команды с диакритическими знаками не выходят прямо. т.е. Sète теперь становится у'S \ xe8te»

ответ

3

Что вы получаете это repr версию строки Юникода, используйте print по отдельным элементам списка, и вы получите правильный выход.

>>> a = [u'S\xe8te'] 
>>> a 
[u'S\xe8te'] 
>>> print a[0] 
Sète 
Смежные вопросы