Есть ли способ обнаружения кодированных символов Windows-1251
?Как обнаружить кодированные символы Windows-1251
IMO, в отличие от многобайтовых нативных символов, Windows-1251
- это 8-битовое кодирование символов, поэтому невозможно отличить его от других 8-битных собственных символов, таких как latin1
. Если я ошибаюсь, пожалуйста, исправьте меня.
Первая подсказка для меня - locale
, я принимаю все non-ascii
символов как Windows-1251
, если локаль ru
.
Есть ли лучшие способы?
UPDATE:
Вот контекст моего вопроса, есть некоторые Windows-1251
закодированные символы в ID3
информации о MP3-файлов, я должен обнаружить Windows-1251
закодированные символы, а затем конвертировать их в UTF-16, используя icu4c
, в противном случае закодированные символы Windows-1251
будут отображаться в моей системе нечитабельно (Android
). Я считаю, что некоторые из вас имеют лучшие способы.
Что вы пытаетесь обнаружить? –
Некоторые файлы MP3 имеют кириллические символы в тегах ID3, которые закодированы в Windows-1251. – Alan
Итак, вы хотите взять файл MP3 и определить, закодированы ли теги ID3 в 1251? –