У меня есть файл test.txt
, который содержит в себе один китайский символ, 中
.Powershell Chinese encoding error
Этот персонаж выглядит так
под видом HEX-редактора.
Если у меня get-content test.txt | Out-File test_output.txt
, содержание test_output.txt
отличается от test.txt
. Почему это хапанское?
Я пробовал все параметры кодирования, перечисленные here ("Unicode", "UTF7", "UTF8", "UTF32", "ASCII", "BigEndianUnicode", "по умолчанию", и "OEM"), но ни один из них не правильно преображает китайский характер.
Как я могу правильно перевести китайские символы с помощью Get-Content
и Out-File
?
Кодировка, e4 b8 ad
, выглядит как URLencode из 中
, поэтому все параметры кодирования не совместимы с этим китайским символом?
Я использую Notepad++ и Notepad ++ hex-editor plugin в качестве текстового редактора и шестнадцатеричного редактора соответственно.
Какая кодировка используется в файле? То есть, что [BOM] (https://en.wikipedia.org/wiki/Byte_order_mark) есть? – vonPryz
Кодировка UTF-8 без спецификации. – Brian