Простой способ сделать XML с кодами HTML?

У меня есть XML-файл, sample.xml, который содержит следующее:Простой способ сделать XML с кодами HTML?

<Tokens> 
    <Token>Hello&nbsp;World</Token> 
</Tokens>

Я хочу, чтобы разобрать его - но получаю ошибки, когда он попадает в NBSP

У меня нет доступа к схема XML, которую я использую (тот, который определяет токен или токены).

DocumentBuilderFactory docBuilderFactory = DocumentBuilderFactory.newInstance(); 
DocumentBuilder docBuilder = docBuilderFactory.newDocumentBuilder(); 
doc = docBuilder.parse("sample.xml");

Поскольку у меня нет схемы для моего XML-документа, мне было интересно, если есть способ, чтобы он полностью игнорировать специальные символы HTML при разборе?

источник

2013-10-04 bigleftie

В XML   является ссылкой на сущность, но неопределенным, если вы не указали определение. Вы не можете заставить анализатор XML игнорировать их, но вы можете определить их, например. начиная ваш документ с

<!DOCTYPE Tokens [<!ENTITY nbsp "&#xa0;">]>

Однако это, вероятно, не полезно, если вы создаете XML-файл. Вы можете просто создать документ, содержащий реальный символ «» U + 00A0 NO-BREAK SPACE, или ссылку на символ   или его десятичный эквивалент  .

Cf. на вопрос How do I define HTML entity references inside a valid XML document?

источник

2013-10-04 18:36:21

То, о чем вы просите, невозможно, потому что для разбора запроса XML объект должен иметь определение где-то. Чтобы проанализировать его как XML, вам нужно написать собственный парсер или использовать толерантный парсер. XML не является супом для тегов.

источник

2013-10-04 17:56:57 Raedwald

XML не поддерживает &nbsp, хотя XHTML делает. Проверьте predefined entities in XML list

Решение состоит в использовании символа пробега Unicode без пробелов &#160 при построении XML; вместо. В некоторых случаях также работает простое пространство (&#32;). Прежде чем разбирать XML, вы можете попытаться заменить &nbsp на «-пространство».

источник

2013-10-04 18:05:19 Sage

Я согласен с Ридвальдом. Но в качестве обходного пути вы можете прочитать файл как строку и заменить поле пробелами перед разбором документа.

источник

2013-10-04 18:07:41 pravat

Простой способ сделать XML с кодами HTML?

ответ

Смежные вопросы