Я понимаю, что .encode('utf-8')
необходим.Как я могу избежать явного декодирования контента?
# -*- coding: utf-8 -*-
import urllib2
url = u'https://fr.wikipedia.org/wiki/Nîmes'
response = urllib2.urlopen(url.encode('utf-8'))
content = response.read().decode('utf-8')
print type(content)
Но как мне избежать .decode('utf-8')
? В конце концов, страница, о которой идет речь, правильно объявляет ее кодировку в заголовке.
Мне нравится минимальные API-интерфейсы, но это делает urllib2 довольно неполным API. – Calaf