Вот мой код:Кодирование/декодирование работает в браузере, но не в терминале
import urllib
print urllib.urlopen('http://www.indianexpress.com/news/heart-of-the-deal/811626/').read().decode('iso-8859-1')
При просмотре страницы в Firefox, текст отображается правильно. Однако на терминале я вижу проблемы с кодировкой символов.
Вот некоторые деформированные примеры вывода:
long-term in Indias no-go areas
Как я могу это исправить?
Возможно, только ваш терминал не смог отобразить определенные наборы символов. * .decode ('iso-8859-1') предоставит вам объект unicode, но он не будет уверен, что ваш терминал может правильно отобразить его. –