Я пытаюсь очистить сайт, но это дает мне ошибку.UnicodeEncodeError: кодек 'charmap' не может кодировать символы
Я использую следующий код:
import urllib.request
from bs4 import BeautifulSoup
get = urllib.request.urlopen("https://www.website.com/")
html = get.read()
soup = BeautifulSoup(html)
print(soup)
И я получаю следующее сообщение об ошибке:
File "C:\Python34\lib\encodings\cp1252.py", line 19, in encode
return codecs.charmap_encode(input,self.errors,encoding_table)[0]
UnicodeEncodeError: 'charmap' codec can't encode characters in position 70924-70950: character maps to <undefined>
Что я могу сделать, чтобы исправить это?
не кодируйте кодировку символов вашей среды (например, консоль) внутри вашего скрипта, [прямо напечатайте Unicode вместо этого] (http://stackoverflow.com/a/32176732/4279) – jfs
Это просто печать объявления объекта 'bytes', который будет печататься как беспорядок последовательностей' \ x', если есть много кодированного текста в формате UTF-8. Я рекомендую использовать 'win_unicode_console', как предлагает @ J.F.Sebastian. – eryksun
Я использовал вышеупомянутое решение, но возникли проблемы: класс MyStreamListener (tweepy.StreamListener): def on_status (self, status): print (str (status.encode ("utf-8"))) UnicodeEncodeError: 'charmap 'codec не может кодировать символ' \ u2019 'в позиции 87: символьные карты в –
Vivek