Я создал приложение Java, которое анализирует текстовый файл для извлечения полей, которые загружаются в таблицу данных. Мы обнаруживаем некоторую обработку исключения, когда таблица не может принимать специальные символы, в частности Â
и тому подобное.Рекомендации по стратегии для удаления специальных символов в java
Эти символы появляются во входном файле как пробелы, когда я смотрю на него, но Java интерпретирует их по-разному. Я подозреваю, что это код символа, который интерпретируется по-разному.
Мой вопрос заключается в следующем: чтобы отфильтровать эти символы, можно ли каким-либо образом создать список того, что видит Java? Я собираюсь напечатать CHAR и код символа, и, если возможно, символ ~ set ~ (ASCII, ANSI, UTF-8 и т. Д.). Из этого я мог бы заменить пространство для символа в моем конечном файле и решить мою проблему.
Есть ли более простое решение, которое я не вижу?
Правильное решение - позволить вашей базе данных обрабатывать такие символы. – Jayan
Не фильтруйте специальные символы. Держите их и научитесь правильно обрабатывать кодировки символов, в конце концов. – artbristol
Вы уверены, что правильно прочитали данные UTF-8? –