2012-07-03 3 views
1

При чтении данных из файла XML я не могу получить нужную строку.
Мой файл XML как то:Как читать специальные символы XML-файла с минидомом

<?xml version="1.0" encoding="ISO-8859-1" ?> 
<Root> 
    <Name>aa é bb</Name> 
</Root> 

Я хотел бы, чтобы правильно прочитать <Name> индуктора. Поэтому я стараюсь команду:

NameValue = Item.getElementsByTagName("Name")[0].childNodes[0].data 

который возвращает в NameValueu'aa \xc3\xa9 bb'.
Так как я могу получить u'aa é bb' или 'aa é bb' в NameValue?
Я пробовал кодировать и декодировать функции без успеха.

Я хотел бы сделать это с помощью Python 2.7.

+0

у уже получить правильное значение Юникода. do u означает кодирование вывода? try print u'aa \ xc3 \ xa9 bb'.encode ("latin1") – fanlix

+0

Я хотел бы сравнить NameValue с другой переменной, содержащей u'aa é bb ' – oaimac

ответ

0

OK У меня есть.
мне удалось сделать это с помощью:

NameValue = unicode(Item.getElementsByTagName("Name")[0].childNodes[0].data.encode("latin-1"), "utf-8") 

Спасибо за вашу помощь fanlix

Смежные вопросы