Хорошо, я надеюсь, что кто-то может помочь, потому что я не смог найти решение для этого.XML не очень хорошо сформирован из-за длинных символов UTF
В базе данных клиентов удалось импортировать или иным образом добавлять символьные данные из другого набора символов, таких как:
<E2><80><99>
Я считаю, что это UTF-16.
XML-выход моего сценария выдает ошибки из-за этих данных (который вытягивает строки, такие как поле описания, из базы данных и создает XML-файл).
Ошибка XML Синтаксический: не хорошо сформированным Порядковый номер 20, столбец 50.
Там какой-то другой шестигранной это больше, как < 80> < 99> (просто пример, я не уверен, если это фактический характер).
Как я могу сделать мой файл XML действителен, и либо уменьшить размер набора символов или заставить его использовать UTF-32, как так:
AddType "application/xml; charset=UTF-32" xml (in .htaccess file along with filesmatch .xml)
<?xml version='1.0' encoding='UTF-32' ?> (placed in head of xml file)
'0xe2 0x80 0x99' является UTF-8 для« ПРАВИЛЬНОЙ ОДИНОЧНОЙ ЦЕЛЕВОЙ МАРКИ »(U + 2019), я думаю, ваша проблема кроется в другом месте. Не могли бы вы показать нам первые несколько строк xml? –
Где вы видите эти ошибки? У вас есть пример URL-адреса? Что такое номер строки 20? Что находится в колонке 50? – hakre
Вот пример: XML Синтаксический Ошибка: не хорошо сформированным Расположение: Http: //xxxx/xml/hal-default.xml Порядковый номер 20, столбец 50: \t \t \t Hangmans Creek Ranch является 190 (специальный символ прямо здесь после того, как "190") акров ранчо Глядя на это с помощью шестнадцатеричного редактора: 0001140 3931 B130 6120 7263 2065 6172 636e 2068 1 9 0 1 зр акр зр ранчо зр Проясняет ли это что-нибудь? –