2015-02-14 3 views
1

Я загружаю файлы csv с помощью jdbc в teradata. Все было хорошо, до недавнего времени я наткнулся на файл csv, в котором были какие-то странные символы, и мой код не смог загрузить.Как очистить файл csv от странных символов (например, SUB)?

Я открыл файл csv в Notepad ++, и он выглядит так: SUB. Когда я открываю его в Excel, он выглядит так: ->->

Когда я удалил эти персонажи вручную, все стало нормальным. Мне любопытно, есть ли способ использовать java для очистки файла csv, чтобы удалить все виды недопустимых символов?

+0

Можете ли вы показать скриншот из Notepad ++ и Excel, где показаны эти символы? –

ответ

3

SUB-символ является ASCII 26 (= шестнадцатеричный 0x1A) , Когда DEC-10 управлял землей, это называлось Ctrl-Z. Он используется для указания конца файла.

Если это действительно в конце файла, и вы читаете его с использованием Java InputStream (и, пожалуйста, взгляните на Read/convert an InputStream to a String), он выведет этот терминал Ctrl-Z.

Было бы довольно необычно (и проблема) иметь SUB внутри CSV-данных, если только он не представлял двоичный объект.

+0

Спасибо. У меня было ощущение, что это конец флага файла, потому что я пытался импортировать его в инструменты BI, такие как SAS и т. Д., И он импортировался до первого 'SUB' –

Смежные вопросы