Ну, есть:
>>> b'\\u00C0'.decode('unicode-escape')
'À'
Однако unicode-escape
кодек нацелен на конкретный формат кодирования строки, строки Python буквальным. Это может привести к неожиданным результатам, когда сталкиваются с другими escape-последовательностями, которые являются особыми в Python, такими как \xC0
, \n
, \\
или \U000000C0
, и он может не распознавать другие escape-последовательности из других форматов строковых литералов. Он также может неправильно обрабатывать символы вне базовой многоязычной плоскости (например, JSON кодирует U + 10000 для суррогатов \uD800\uDC00
).
Так что, если ваши входные данные на самом деле не являются строковым литералом на языке Python, лишенным его разделителей цитат, это неправильная вещь, и это, вероятно, приведет к нежелательным результатам для некоторых из этих случаев. Существует множество форматов, которые используют \u
для обозначения символов Unicode; вы должны попытаться выяснить, в каком формате это точно, и использовать декодер для этой схемы. Например, если файл JSON, правильная вещь - использовать анализатор JSON вместо того, чтобы пытаться обрабатывать \u
/\n
/\\
/etc самостоятельно.
Возможный дубликат [Как преобразовать escape-последовательности Unicode в символы Unicode в строке python] (http://stackoverflow.com/questions/990169/how-do-convert-unicode-escape-sequences-to-unicode- characters-in-a-python-string) – tripleee