Я конвертирую CSV-файл из Tatoeba проект. Он содержит японские символы. Я вставляю данные в базу данных SQLite. Вставка идет без проблем, но символы отображаются неправильно. Если вставить непосредственно:Японский символ не отображается правильно преобразование CSV-файла
String str = content_parts[2];
sentence.setValue(str);
Получение значения, как это:
ãã¿ã «ã¡ãã £ ã¨ãããã®ããã £ ã|ãããã
Я попытался для декодирования в UTF8 от JIS:
String str = content_parts[2];
byte[] utf8EncodedBytes = str.getBytes("JIS");
String s = new String(utf8EncodedBytes, "UTF-8");
sentence.setValue(s);
JIS:
$ B!)!)!)!)!)!)!)!)!)!)!!!!!!!!!!!!!!!!!!!)!! !)!)!)!)!)!)!)!)!)!)!)!)!)!)!)!)!)!)!)!)!р!)!)!)!) !!!!!!!!!!))))))))))) (B
Shift-JIS:
???? \ ????? ? Н?} ??????????????????????? N? N ?????????
Shift_JIS:
???? \ ????????????????????????? N ?? ??????????????????????
CSV файл (если открыт Excel 2010)
п гЃЌгЃїгЃ «гЃЎг, ‡ гЃЈгЃЁгЃ-гЃџг,,гЃ®г,'г,,гЃЈгЃ|гЃЌгЃџг, € гЂ,
Что я делаю неправильно? Как решить эту проблему?
Какую кодировку использует этот файл в файле? – immibis
Может быть, проблема связана с кодировкой базы данных, а не с отображением java – ortis
@immibis, честно говоря, я не знаю. теперь я ищу, как определить кодировку –