Я хочу знать, есть ли способ обнаружить символы мохибак (Неверные) по их байтовому диапазону. (Для простого примера обнаружение действительных символов ascii - это просто увидеть, меньше ли их байтовых значений 128). Учитывая старые настроенные наборы символов, такие как JIS, EUC и, конечно же, UNICODE, есть ли способ сделать это?Japanese mojibake detection
Непосредственный интерес представляет собой проект C#, но я хотел бы как можно больше найти независимое от языка/платформу решение, поэтому я мог бы использовать его в C++, Java, PHP или любом другом.
Arrigato
Вы видите Arigatou неправильно :) – MGZero
Да, но это всегда зависит от того, какой системы латинизации вы используете - так же, как вам» повторное использование 'u' для длинного гласного. – Mikaveli
Я использовал «romagi», чтобы еще больше запутать вещи. – Jahmic