Я загружаю файл с кучей символов Юникода (например, \xe9\x87\x8b
). Я хочу преобразовать эти символы в свою форму escaped-unicode (\u91cb
) в Python. Я нашел пару подобных вопросов здесь, в StackOverflow, включая этот Evaluate UTF-8 literal escape sequences in a string in Python3, который делает почти то, что я хочу, но я не могу решить, как сохранить данные.Как преобразовать unicode в unicode-escaped текст
Например: входного файла:
\xe9\x87\x8b
Python Script
file = open("input.txt", "r")
text = file.read()
file.close()
encoded = text.encode().decode('unicode-escape').encode('latin1').decode('utf-8')
file = open("output.txt", "w")
file.write(encoded) # fails with a unicode exception
file.close()
Output File (То, что я хотел):
\u91cb
Что такое 'print (open ('input.txt', 'rb'). Read())'? Это 'b '\ xe9 \ x87 \ x8b'' или' b' \\ xe9 \\ x87 \\ x8b''? – jfs