2015-04-06 5 views
0

Я работаю над приложением, которое импортирует данные из файла CSV. Мне сказали, что данные в файле CSV поступают из SAP, с которым я совершенно незнакома.Каков вероятный смысл этой последовательности символов? A & # C

Мой клиент указывает, что есть проблема. Один столбец данных в файле CSV содержит почтовые адреса. Иногда система не видит действительного адреса. Вот немного придуман пример:

1234 MAIN ST A&#C HOUSTON 

Как вы можете видеть, есть ряд улицы, название улицы и город, все прописные буквы. Нет указанного состояния или почтового индекса. В CSV-файле предполагается, что все адреса находятся в одном состоянии.

Как правило, там, где есть текст между названием улицы и городом, это номер квартиры или письмо. В приведенном выше примере мы получаем ошибки, когда пытаемся использовать адрес с другими службами, такими как геолокация Google. Одно из возможных исправлений заключается в том, чтобы просто выделять специальные символы, но я считаю, что должен быть лучший способ.

Я хочу знать, что это такое A&#C означает. Это похоже на какую-то escape-последовательность, но это не в формате, с которым я знаком. Скажите, пожалуйста, что означает эта странная последовательность символов.

ответ

1

Я не совсем уверен, но я сомневаюсь, что существует «каноническая» escape-последовательность, которая выглядит так. В среде ABAP # используется для замены непечатаемых символов. Возможно, данные были неправильно обработаны при импорте в систему SAP в первую очередь, и при записи в выходной файл некоторые непечатаемые символы были заменены на #. Другим объяснением может быть то, что одно из полей содержало символ unicode без ASCII (например,   ), а программа экспорта не смогла преобразовать его в выбранную целевую кодовую страницу. Трудно сказать, не исследуя фактический набор данных источника. Конечно, это может быть и некоторая ошибка программирования или странный пользовательский разделитель полей ...

+0

После прочтения вашего вопроса я решил проверить и увидеть, что '#' и '&' отображаются в действительных данных и, они выглядят как аббревиатуры для «числа» и «и» соответственно. Я думаю, что, возможно, меня озадачивает простая опечатка от пользователя. –

Смежные вопросы