Страница кодируется в UTF-8, а HTML-файл python работает хорошо, нет UnicodeDecodeError
, но я получаю сообщение об ошибке, когда пытаюсь разобрать его с помощью BeautifulSoup. Я пробовал _*_
кодирование: utf-8 _*_
, .encode('utf-8')
везде, и я все еще получаю ошибкузастрял с кодировками в python с BeautifulSoup
import urllib
from BeautifulSoup import BeautifulSoup
args=urllib.urlencode({'keywords':'magic'})
doc=urllib.urlopen('http://www.example.com/submit', args)
soup=BeautifulSoup(doc)
stuff = soup.findAll('section',id='banner')
print stuff
Traceback (most recent call last):
File "test.py", line 7, in <module>
print stuff
UnicodeEncodeError: 'ascii' codec can't encode character u'\xed' in position 112: ordinal not in range(128)