я заметил следующие трюмы:Будет ли строка UNICODE, содержащая только символы ASCII, всегда равна строке ASCII?
>>> u'abc' == 'abc'
True
>>> 'abc' == u'abc'
True
Будет ли это всегда быть правдой или это могло возможно зависеть от языка системы? (кажется строки Юникода в Python 3: например this question, но байты в 2.x)
Символы в наборе ASCII являются агностиками кодировки. Это только расширенные символы (от 0x80 до 0xff), которые могут различаться между локалями. – Phylogenesis
@Phylogenesis: существует множество кодировок, которые * не * используют ASCII в качестве базы. –