У меня есть HTML текст, как это:Заменить HTML объекты с соответствующими UTF-8 символов в Python 2.6
<xml ... >
и я хочу, чтобы преобразовать его в нечто читаемом:
<xml ...>
Любой простой (и быстрый) способ сделать это в Python?
У меня есть HTML текст, как это:Заменить HTML объекты с соответствующими UTF-8 символов в Python 2.6
<xml ... >
и я хочу, чтобы преобразовать его в нечто читаемом:
<xml ...>
Любой простой (и быстрый) способ сделать это в Python?
http://docs.python.org/library/htmlparser.html
>>> import HTMLParser
>>> pars = HTMLParser.HTMLParser()
>>> pars.unescape('© €')
u'\xa9 \u20ac'
>>> print _
© €
Существует функция here, что делает его, как связанные с поста Фред указал. Скопировано здесь, чтобы облегчить ситуацию.
Кредит Фреду Ларсону для связи с другим вопросом на SO. Кредит dF за размещение ссылки.
Я думаю, что вопрос является дубликатом этого: http://stackoverflow.com/questions/57708/convert-xml-html-entities-into-unicode-string-in-python –
Возможный дубликат [Декодирование HTML-объектов в строке Python?] (http://stackoverflow.com/questions/2087370/decode-html-entities-in-python-string) – csl