2010-06-03 2 views
79

Каковы правильные типы контента для документов XML, HTML и XHTML?Допустимый тип содержимого для документов XML, HTML и XHTML

Мне нужно написать простой искатель, который извлекает только эти файлы.

В настоящее время http://example.net/index.html может служить, например, файлом JPEG из-за mod_rewrite, поэтому мне нужно проверить тип содержимого из заголовка ответа и сравнить его со списком разрешенных типов контента.

Откуда я могу получить такой список?

+0

О фрагментах см http://stackoverflow.com/q/19303361/287948 и https: // www.w3.org/TR/xml-fragment –

ответ

136

HTML: text/html, полная остановка.

XHTML: application/xhtml+xml, или только в том случае, если следующие рекомендации по совместимости с HTML, text/html. См. W3 Media Types Note.

XML: text/xml, application/xml (RFC 2376).

Существует также множество других типов носителей, основанных на XML, например application/rss+xml или image/svg+xml. Это безопасная ставка, что любое нераспознанное, но зарегистрированное окончание в +xml основано на XML. См. IANA list для зарегистрированных типов носителей, заканчивающихся на +xml.

(. Для незарегистрированных x- типов, все ставки выключены, но вы бы надеяться +xml будет соблюден)

+17

О различиях между «text/xml» и «application/xml» см. здесь http://stackoverflow.com/questions/4832357/whats-the-difference-between-text- xml-vs-application-xml-for-webservice-respons – sanmai

+0

То же самое верно для * фрагментов *, см. http://w3.org/TR/xml-fragment или [this other qustion] (http: // stackoverflow. ком/кв/19303361/287948). –

Смежные вопросы