Новое на python и lxml, поэтому, пожалуйста, несите меня. Теперь застрял в том, что похоже на проблему с unicode. Я попробовал .encode, красивый юбокодэммит из супа без везения. Если бы вы искали форум и веб-сайт, но моя нехватка навыка python не смогла применить предлагаемое решение для моего конкретного кода. Цените любую помощь, спасибо.lxml unicode output issue
Код:
import requests
import lxml.html
sourceUrl = "http://www.hkex.com.hk/eng/market/sec_tradinfo/stockcode/eisdeqty.htm"
sourceHtml = requests.get(sourceUrl)
htmlTree = lxml.html.fromstring(sourceHtml.text)
for stockCodes in htmlTree.xpath('''/html/body/printfriendly/table/tr/td/table/tr/td/table/tr/table/tr/td'''):
string = stockCodes.text
print string
Ошибка:
UnicodeEncodeError: 'ascii' codec can't encode character u'\xa0' in position 0: ordinal not in range(128)
Не могли бы вы предоставить более подробную информацию об ошибке? Или добавьте строку 'print type (string)' before 'print string', чтобы узнать, что произошло. – iceout