Я использую urlfetch для извлечения URL-адреса. Когда я пытаюсь отправить его html2text функции (отсекает все HTML-тег), я получаю следующее сообщение:UnicodeEncodeError при выборе URL-адресов
UnicodeEncodeError: 'charmap' codec can't encode characters in position ... character maps to <undefined>
Я пытался обработать закодировать («UTF-8», «игнорировать») на строка, но я продолжаю получать эту ошибку.
Любые идеи?
Спасибо,
Joel
Некоторые Код:
result = urlfetch.fetch(url="http://www.google.com")
html2text(result.content.encode('utf-8', 'ignore'))
И сообщение об ошибке:
File "C:\Python26\lib\encodings\cp1252.py", line 12, in encode
return codecs.charmap_encode(input,errors,encoding_table)
UnicodeEncodeError: 'charmap' codec can't encode characters in position 159-165: character maps to <undefined>
Пожалуйста, добавьте 'content_type = result.headers.getheader ('Content-Type'); print (content_type) 'на ваш код (после' result = urlfetch.fetch (...) ') и сообщите нам результат. – unutbu
Выход: «windows-1255». Я попытался переключиться на html2text (result.content.decode («windows-1255», «игнорировать»)), но я все равно получаю «UnicodeEncodeError: кодек charmap» не может кодировать символы в позиции 2-8: символьные карты до « –
Joel