2010-10-08 3 views
0

Я попытался изо всех сил ответить на этот вопрос сам по исследованиям, но я все еще немного беспокоюсь о том, использую ли я правильную вещь. В основном я использую библиотеку DomDocument для создания jQuery, такого как парсер для моей рамки. Теперь с сетью, как и сегодня, HTML приходит в разных формах и размерах, например, HTML 4, HTML 5, XHTML, XHTML 5 и т. Д. Проблема, которую я нахожу с помощью DomDocument, заключается в том, что если вы дадите код HTML, это будет работайте только с ним, если это соответствует стандартам XHTML. Я знаю, что он может преобразовать его в XHTML, и я могу использовать аккуратную библиотеку, чтобы сделать код приемлемым, но мое главное беспокойство: что, если разработчик, использующий мою инфраструктуру, имеет тему, которая использует все классные (обсуждаемые) новые функции HTML 5, как только он передает его в мои рамки, он либо бросит истерику, либо преобразует ее в XHTML, который сосать.Должен ли я использовать DomDocument для разбора html-кода

Так что мой вопрос: Является ли DomDocument самой удобной библиотекой для чего мне нужно?

или

Есть ли способ заставить его работать со всеми различными вариантами HTML?

ответ

1

DOMDocument может анализировать файлы, отличные от XHTML. Просто установите соответствующие переключатели:

libxml_use_internal_errors (true); 

    $dom = new DOMDocument; 
    $dom -> formatOutput = true; 
    $dom -> substituteEntities = false; 
    $dom -> recover = true; 
    $dom -> strictErrorChecking = false; 
+0

hmm, il дать попробовать –

Смежные вопросы