2016-01-19 2 views
0

Здравствуйте, я создаю простое приложение для Android, которое позволяет пользователю искать kanji и видеть его «части». Для этого я читаю с data file, который я нашел на сайте this и содержит части кандзи, которые мне нужно отобразить.Как перекодировать EUC-JP в Unicode таким образом, который может быть отображен пользователю?

Проблема в том, что он не закодирован в Юникоде, и я еще не нашел программу, которая может правильно отображать содержимое файла. Я не совсем уверен, что такое кодировка, но я подозреваю, что это CP932.

Как перекодировать файл на что-то, что может отображаться пользователю (и манипулировать с помощью java)?

Вот пример из содержимого:

±ú : Ñá 
±û : ¥Î °ì Âç ÑÌ 
±ü : Âç ÊÆ ÑÄ 
±ý : ²¦ Ц ×Æ 
±þ : ¿´ Öø 
²¡ : ¡Ã Æü Ù© ÅÄ 
²¢ : ²¦ Æü 
²£ : ¡Ã ²« ÅÄ Æó Æü ¥Ï ÌÚ ×° 
²¤ : ·ç Ò¹ ¥Î Ц 
²¥ : ¥Î Ц Ò¹ ÝÕ ÑÜ Ëô 
²¦ : ²¦ 
²§ : ±© ¥Ï ÑÒ ÒÓ 
²¨ : ½é Âç ÊÆ ÑÄ ÈÐ 
²© : ¾° Ä» ÑÌ Û¿ 
²ª : Ä» Ò¹ Û¿ ¥Î Ц 
²« : ²« ÅÄ ¥Ï 
²¬ : Öõ ÑÄ °ì »³ ²¬ 
²­ : ¡Ã ½Á ¸ý 
²® : ²Ð ÈÈ çè 
²¯ : ²» ²½ ¿´ Æü Ω 
²° : »ê ÅÚ ÒÓ Õù 
²± : ²» ¿´ Æü Ë» Ω 
²² : ²» ·î ¿´ Æü Ω 
²³ : ÌÚ ÍÑ ¥Þ 
²´ : µí ÅÚ 
²µ : ²µ 
²¶ : ²µ ²½ Âç ±â 

ответ

1

Файл кодируется в EUC-JP (не Shift-JIS или cp932). Вы можете преобразовать файл в автономный режим UTF с помощью инструмента, например iconv, или преобразовать его онлайн, указав кодировку при создании InputStreamReader, чтобы прочитать файл.

Смежные вопросы