2014-02-10 2 views
0

Так что я читал в некоторых XML от 3 участника (читай: я не могу определить, или прикоснуться к XML приходит ко мне) и один из файлов был следующий ...Текст Xml не может содержать «One Half» & frac12; html-символ?

.. within 2 ½ hours to major centers ...

Когда я удалите оскорбительное слово [½], он загружается в Дом.

// First, read in the XML. 
var xmlDocument = new XmlDocument { XmlResolver = null }; 
xmlDocument.LoadXml(xmlText); 

Я знаю, что правильное решение здесь будет CData, что текст вещь - но я не достаю их, чтобы изменить свои данные. (Лично реальное решение будет Гот json, но давайте не туда ...)

Я действительно не хочу иметь черный список слов которые я раздеть :(Это звучит .. болезненным. Особенно, когда текст может быть Сорта большой .. как ДО 1Мб. Просто чувствует неправильно.

есть ли другие варианты?

ответ

1

Urgh.

Найдено мой собственный ответ :(Xml только позволяет 5 предопределенных объектов из коробки.

Все остальное должно быть объявлено вручную в DTD.

К quote wikipedia.

Спецификация XML не использует термин «символьная сущность» или «ссылка на символ». Спецификация XML определяет пять предопределенных сущностей , представляющих специальные символы, и требует , что все процессоры XML почитают их. Сущности могут быть явно , также объявленные в DTD, но если это делается, текст замены должен быть таким же, как и в встроенных определениях. XML также позволяет другим названным объектам любого размера быть определенными для каждого документа.

This SO question и this one говорить об этом.

Смежные вопросы