2015-01-30 4 views
0

Уважаемые дружелюбные специалисты питон,Python - BeautifulSoup - немецкие символы в HTML

Я использую BeautifulSoup, чтобы очистить некоторые HTML текст с сайта. Этот сайт содержит немецкие слова, такие как «Groß» или «Bär». Когда я печатаю html-текст, эти символы переводят довольно неприятно, так что слишком сложно искать текст html для слов.

Как я могу заменить ß к сс, ä к ае, ü к, ö к ое, в HTML тексте?

Я искал решение всюду к этому, однако это не получило меня нигде, кроме замешательства земли

Поскольку это поможет проект очень признателен!

+1

Если ваш вопрос заключается в том, как заменить символы в строке, это поможет сначала прочитать учебник по python. В противном случае, пожалуйста, покажите сжатый, рабочий фрагмент кода того, что у вас есть, и сообщите нам, чего вы хотите достичь, и почему это не сработает. – phobic

+0

Вы совершенно правы. Я читал http://www.joelonsoftware.com/articles/Unicode.html. Mind openener и должен читать для начинающих питона. –

ответ

0

При чтении присваивать текст переменной и декодировать ее, например, если ваш текст хранится под переменной Var, тогда при чтении используйте Var.decode("utf-8").

Смежные вопросы