2011-02-10 4 views

ответ

17

Это UTF-8, декодированный как латинский-1, кодированный как UTF-8, декодированный как CP1252.

>>> u'’'.encode('cp1252').decode('utf8').encode('latin1').decode('utf8') 
u'\u2019' 

Серьезно ... кто это делает?

+0

Я догадался, что это была ошибка * triple * -encode и вздохнула :) – hobbs

+6

Как вы это поняли? –

+1

Кроме того, у него есть типографская правая кавычка вместо того, что, очевидно, должно быть апострофом. – hobbs

Смежные вопросы