Есть ли символы, которые закодированы в HTML, но не XML, или наоборот?Существуют ли различия между специальной кодировкой символов XML и HTML?
Все ли кодировки одинаковы между собой? Подобно & gt; для большего, чем символ?
Есть ли символы, которые закодированы в HTML, но не XML, или наоборот?Существуют ли различия между специальной кодировкой символов XML и HTML?
Все ли кодировки одинаковы между собой? Подобно & gt; для большего, чем символ?
XML предопределяет несколько объектов символов. Смотрите раздел 4.6 XML 1.1 спецификации:
http://www.w3.org/TR/xml11/#sec-predefined-ent
В частности, XML-определяет & л ;, & GT ;, & амп ;, & APOS ;, и & Quot; («Все XML-процессоры ДОЛЖНЫ распознавать эти сущности независимо от того, объявлены они или нет»). Любые другие объекты должны ссылаться посредством числовой ссылки, как указано Брайаном, или соответствующим определением в конструкции <! ENTITY ... > в самом документе или DTD с ссылкой.
Все эти сущности также определены в HTML.
Да. HTML4 определяет количество именованных объектов, которые по умолчанию отсутствуют в XML. Вы можете увидеть list on the w3.org website. >
является одним из таких закодированных объектов. Аналогично, <
является именованным объектом для <
, но вы также можете написать его так: <
. Насколько я знаю, вы можете свободно использовать пронумерованную версию в HTML и XML. См. Ссылку w3.org для определения ваших собственных объектов в XML-документах.
Хотя, как указано в http://stackoverflow.com/questions/2083754/why-shouldnt-apos-be-used-to-escape-single-quotes, escape-последовательность apos НЕ является частью спецификации HTML и не поддерживается некоторыми браузерами – evnafets
@evnafets: «определенные браузеры» = IE8, обычный подозреваемый –