У меня есть файлы, содержащие строки и необходимые для их преобразования в UTF8 с perl, есть ли опция с perl для запуска над этими файлами и конвертировать каждую строку в utf8, и если некоторые строки закодированы в utf8 сохранить их как есть?преобразование строки в UTF8 с perl
ответ
Вы можете использовать модуль Encode для преобразования между кодировками. (Нет необходимости устанавливать что-либо, это часть основных библиотек.) Обратите внимание, что «преобразование строки в UTF-8» требует, чтобы вы знали, из какой кодировки вы переходите; нет возможности надежно идентифицировать 8-битные кодировки текста.
Вы сказали, что некоторые части файла закодированы с использованием UTF-8, а некоторые кодируются с использованием чего-то другого, но вы не указали другую кодировку, и это важно.
Вообще говоря, невозможно описать кодировку строки, посмотрев на нее. Но если вы имеете дело с комбинацией US-ASCII, iso-8859-1, cp1252 и UTF-8, вероятность того, что вы действительно можете сказать *, и кто-то уже написал этот инструмент для вас.
Encoding::FixLatin поставляется со сценарием fix_latin
, который преобразует файл, который представляет собой смесь вышеуказанных кодировок в UTF-8.
- 1. Преобразование строки в UTF8
- 2. Преобразование строки в UTF8
- 3. UTF8 байт [] преобразование строки
- 4. Преобразование строки latin1 в utf8?
- 5. преобразование строки в формат UTF8
- 6. Преобразование ASCII-кодированной строки в UTF8?
- 7. Преобразование строки Юникода в строку PHP utf8
- 8. Ямл загружает преобразование строки в UTF8?
- 9. utf8 не преобразование строки в PHP
- 10. Преобразование строки JSON UTF8 в NSDictionary Swift
- 11. Perl: Преобразование строки в ссылку?
- 12. Преобразование ANSI в UTF8
- 13. Преобразование и отображение кодированной строки UTF8
- 14. Другой преобразование строки URL utf8 Java
- 15. Преобразование Utf8 в Юникод
- 16. Преобразование из EBCDIC в UTF8 в Linux
- 17. Преобразование из Unicode в UTF8
- 18. perl utf8 коррупция
- 19. Oddity с UTF8 в регулярных выражениях perl
- 20. Преобразовать UTF8 строки в числовые значения в Perl
- 21. Преобразование UTF8 Шестнадцатеричная строка в обычную кодировку UTF8 NSString
- 22. Преобразование строки в кодировке utf8 в юникод в C#
- 23. Преобразование строки в массив в Perl
- 24. Преобразование строки из utf8 в latin1 в NodeJS
- 25. MySQL - Преобразование latin1 символов на столе UTF8 в UTF8
- 26. Преобразование строк из Utf8
- 27. Преобразование UTF8 в Windows-1252
- 28. Broken utf8 преобразование?
- 29. Преобразование из UTF8 в ASCII
- 30. Преобразование UTF8 в UTF16 с помощью iconv