PHP «pretty print» HTML (not Tidy)

Я использую расширение DOM в PHP для создания некоторых HTML-документов, и я хочу, чтобы результат был отформатирован красиво (с новыми строками и отступом), чтобы он был доступен для чтения от многих тестов я сделал:PHP «pretty print» HTML (not Tidy)

"formatOutput = истина" не работает вообще с saveHTML(), только saveXML()
Даже если я использовал saveXML(), она до сих пор только работает над элементами, созданными с помощью DOM, а не элементами, которые входят в loadHTML(), даже с «preserveWhiteSpace = false»

Если кто-то знает по-другому, мне бы очень хотелось узнать, как они наняли его.

Итак, у меня есть документ DOM, и я использую saveHTML() для вывода HTML. Поскольку это происходит из DOM, я знаю, что это действительно так, нет необходимости «убирать» или проверять его каким-либо образом.

Я просто ищу способ получить красиво отформатированный вывод с вывода, получаемого с расширения DOM.

NB. Как вы могли догадаться, я не хочу использовать расширение Tidy как a) он делает намного больше, что мне тоже нужно (разметка уже допустима), и b) она фактически вносит изменения в содержимое HTML (например, HTML-тип и некоторые элементы).

Follow Up:

ОК, с помощью ответа ниже я работал, почему расширение DOM не работает. Хотя данный пример работает, он все еще не работал с моим кодом. С помощью комментария this я обнаружил, что если у вас есть текстовые узлы, где isWhitespaceInElementContent() истинно, форматирование не будет применяться после этой точки. Это происходит независимо от того, является ли сохранениеWhiteSpace ложным. Решение состоит в том, чтобы удалить все эти узлы (хотя я не уверен, что это может отрицательно сказаться на фактическом содержании).

источник

2009-04-20 Jack Sleight

Вы правы, похоже, для HTML нет отступов (others are also confused). XML работает даже с загруженным кодом.

<?php 
function tidyHTML($buffer) { 
    // load our document into a DOM object 
    $dom = new DOMDocument(); 
    // we want nice output 
    $dom->preserveWhiteSpace = false; 
    $dom->loadHTML($buffer); 
    $dom->formatOutput = true; 
    return($dom->saveHTML()); 
} 

// start output buffering, using our nice 
// callback function to format the output. 
ob_start("tidyHTML"); 

?> 
<html> 
    <head> 
    <title>foo bar</title><meta name="bar" value="foo"><body><h1>bar foo</h1><p>It's like comparing apples to oranges.</p></body></html> 
<?php 
// this will be called implicitly, but we'll 
// call it manually to illustrate the point. 
ob_end_flush(); 
?>

результат:

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd"> 
<html> 
<head> 
<title>foo bar</title> 
<meta name="bar" value="foo"> 
</head> 
<body> 
<h1>bar foo</h1> 
<p>It's like comparing apples to oranges.</p> 
</body> 
</html>

же с saveXML() ...

<?xml version="1.0" standalone="yes"?> 
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd"> 
<html> 
    <head> 
    <title>foo bar</title> 
    <meta name="bar" value="foo"/> 
    </head> 
    <body> 
    <h1>bar foo</h1> 
    <p>It's like comparing apples to oranges.</p> 
    </body> 
</html>

вероятно забыли установить preserveWhiteSpace = ложь, прежде чем loadHTML?

отказ от ответственности: я украл большую часть демонстрационного кода от tyson clugg/php manual comments. ленивый.

UPDATE: я помню сейчас несколько лет назад я попробовал то же самое и столкнулся с той же проблемой. Я исправил это, применив грязное обходное решение (не критично для производительности): я как-то конвертировал между SimpleXML и DOM, пока проблема не исчезла. я полагаю, что преобразование избавилось от этих узлов.возможно, загрузите с dom, импортируйте с simplexml_import_dom, затем выведите строку, проанализируйте это с помощью DOM снова и , затем напечатайте его довольно. насколько я помню, это сработало (но это было действительно slow).

источник

2009-04-20 14:04:47 stefs

Спасибо. С вашими примерами и комментариями на php.net я разработал проблему (см. Выше). –

Решение с DOM кажется мне совершенно тяжеловесным. Как быстро или медленно? Стоит ли использовать его также на небольших фрагментах или только на всей странице? – sumid

Существует проблема при использовании 'saveXML()' с некоторыми тегами без значения, например '' он преобразует его в ' 'есть ли способ, я могу это исправить? – <span class="text-secondary"> <small> <span>2014-01-06 18:25:14</span> </small> </span> </p> </div> </div> </div> </div> </div> </article> <div> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="4319274062" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">5<i class="fa fa-thumbs-up"></i></span> </div> <div class="post-offset"> <div class="answer fmt"> <p>Когда я была связка XML пространства имен tidyHTML не нравится, наткнулся на это:</p> <p><a href="http://gdatatips.blogspot.com/2008/11/xml-php-pretty-printer.html" rel="noreferrer">http://gdatatips.blogspot.com/2008/11/xml-php-pretty-printer.html</a></p> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/3534409">источник</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2010-08-20 19:54:38</span> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/194021/">Garvin</a></span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div> </div> </article> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">0<i class="fa fa-thumbs-up"></i></span> </div> <div class="post-offset"> <div class="answer fmt"> <p>Вы можете использовать код для <a href="http://www.bioinformatics.org/phplabware/sourceer/sourceer.php?&Sfs=htmLawed.php&Sl=.%2Finternal_utilities%2FhtmLawed" rel="nofollow">hl_tidy</a> функции <a href="http://www.bioinformatics.org/phplabware/internal_utilities/htmLawed/index.php" rel="nofollow">htmLawed</a> библиотеки.</p> <pre><code class="prettyprint-override">// indent using one tab per indent, with all HTML being within an imaginary div $out = hl_tidy($in, 't', 'div') </code></pre> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/11936506">источник</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2012-08-13 14:37:01</span> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/594694/">user594694</a></span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div> </div> </article> </div> <div class="clearfix"> </div> <div class="relative-box"> <div class="relative">Смежные вопросы</div> <ul class="relative_list"> <li> 1. <a href="http://ru.voidcc.com/question/p-bknqyfgk-bpw.html" target="_blank" title="Pretty print not working?"> Pretty print not working? </a> </li> <li> 2. <a href="http://ru.voidcc.com/question/p-pbqetdux-sx.html" target="_blank" title="Pretty Print/HTML Tidy для Google Web Toolkit (GWT)?"> Pretty Print/HTML Tidy для Google Web Toolkit (GWT)? </a> </li> <li> 3. <a href="http://ru.voidcc.com/question/p-csdptvku-zq.html" target="_blank" title="Pretty-print Java, XML, JavaScript, ... to HTML"> Pretty-print Java, XML, JavaScript, ... to HTML </a> </li> <li> 4. <a href="http://ru.voidcc.com/question/p-cpfjhrmi-pt.html" target="_blank" title="Pretty Print HTML в Ruby (или Shell)"> Pretty Print HTML в Ruby (или Shell) </a> </li> <li> 5. <a href="http://ru.voidcc.com/question/p-oalhbugp-bhv.html" target="_blank" title="Pretty print namedtuple"> Pretty print namedtuple </a> </li> <li> 6. <a href="http://ru.voidcc.com/question/p-szptsfyy-p.html" target="_blank" title="pretty print makefiles"> pretty print makefiles </a> </li> <li> 7. <a href="http://ru.voidcc.com/question/p-mkmkwguw-bqq.html" target="_blank" title="Pretty-print with awk?"> Pretty-print with awk? </a> </li> <li> 8. <a href="http://ru.voidcc.com/question/p-duuyfzyz-uq.html" target="_blank" title="Coldfusion - XML Pretty Print"> Coldfusion - XML Pretty Print </a> </li> <li> 9. <a href="http://ru.voidcc.com/question/p-aebnhprb-ma.html" target="_blank" title="Pretty Print Excel Формулы?"> Pretty Print Excel Формулы? </a> </li> <li> 10. <a href="http://ru.voidcc.com/question/p-azctnugg-bne.html" target="_blank" title="JSON pretty print customization"> JSON pretty print customization </a> </li> <li> 11. <a href="http://ru.voidcc.com/question/p-zlmmclcv-bv.html" target="_blank" title="Javascript + Pretty Print JSON"> Javascript + Pretty Print JSON </a> </li> <li> 12. <a href="http://ru.voidcc.com/question/p-pskkgekw-tv.html" target="_blank" title="Jackson pretty print string"> Jackson pretty print string </a> </li> <li> 13. <a href="http://ru.voidcc.com/question/p-nctxpupz-bct.html" target="_blank" title="JSON pretty print with highlighting"> JSON pretty print with highlighting </a> </li> <li> 14. <a href="http://ru.voidcc.com/question/p-gptqvcqu-cm.html" target="_blank" title="gcc - gdb - pretty print stl"> gcc - gdb - pretty print stl </a> </li> <li> 15. <a href="http://ru.voidcc.com/question/p-pjlvrkji-bdw.html" target="_blank" title="Spark SQL DataFrame pretty print"> Spark SQL DataFrame pretty print </a> </li> <li> 16. <a href="http://ru.voidcc.com/question/p-otnraszl-y.html" target="_blank" title="java-pretty print sql query"> java-pretty print sql query </a> </li> <li> 17. <a href="http://ru.voidcc.com/question/p-gcdcahdt-yp.html" target="_blank" title="Pretty-print for shell script"> Pretty-print for shell script </a> </li> <li> 18. <a href="http://ru.voidcc.com/question/p-ddpdfhhu-bkr.html" target="_blank" title="Pretty Print SQL в Ruby"> Pretty Print SQL в Ruby </a> </li> <li> 19. <a href="http://ru.voidcc.com/question/p-eubuadwg-bkr.html" target="_blank" title="Pretty print Результаты SQL Java"> Pretty print Результаты SQL Java </a> </li> <li> 20. <a href="http://ru.voidcc.com/question/p-vokpbgit-bdk.html" target="_blank" title="Pretty Print JSON с JBuilder"> Pretty Print JSON с JBuilder </a> </li> <li> 21. <a href="http://ru.voidcc.com/question/p-fpprgrkp-da.html" target="_blank" title="Pretty Print Расстояния для iOS"> Pretty Print Расстояния для iOS </a> </li> <li> 22. <a href="http://ru.voidcc.com/question/p-vqvshmzk-gx.html" target="_blank" title="Pretty-print AudioFormatID в Xcode"> Pretty-print AudioFormatID в Xcode </a> </li> <li> 23. <a href="http://ru.voidcc.com/question/p-xegtjqwr-yz.html" target="_blank" title="Pretty Print Haxe JS Output"> Pretty Print Haxe JS Output </a> </li> <li> 24. <a href="http://ru.voidcc.com/question/p-rgsykrmr-bnx.html" target="_blank" title="Pretty print Python xml.dom.Element object"> Pretty print Python xml.dom.Element object </a> </li> <li> 25. <a href="http://ru.voidcc.com/question/p-hmeahkxl-cx.html" target="_blank" title="MongoDB Print Pretty with PyMongo"> MongoDB Print Pretty with PyMongo </a> </li> <li> 26. <a href="http://ru.voidcc.com/question/p-xhmulpbl-px.html" target="_blank" title="gdb pretty print не работает"> gdb pretty print не работает </a> </li> <li> 27. <a href="http://ru.voidcc.com/question/p-qcnaimmv-bcn.html" target="_blank" title="Pretty-Print JSON в Java"> Pretty-Print JSON в Java </a> </li> <li> 28. <a href="http://ru.voidcc.com/question/p-uauulkwq-bkb.html" target="_blank" title="Parse valid html (php - tidy)"> Parse valid html (php - tidy) </a> </li> <li> 29. <a href="http://ru.voidcc.com/question/p-kgllhpyp-qq.html" target="_blank" title="Pretty Photo not working"> Pretty Photo not working </a> </li> <li> 30. <a href="http://ru.voidcc.com/question/p-cykjqiot-bgy.html" target="_blank" title="Pretty print json object in smarty"> Pretty print json object in smarty </a> </li> </ul> </div> <div> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-format="autorelaxed" data-ad-client="ca-pub-6208739752673518" data-ad-slot="3534119089"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="padding-top-10"></div> </div> </div> <script type="text/javascript" src="http://img2.voidcc.com/voidso/script/side.js?t=1652515422009"></script> <script type="text/javascript" src="http://img2.voidcc.com/voidso/plugin/highlight/highlight.pack.js"></script> <link href="http://img2.voidcc.com/voidso/plugin/highlight/styles/docco.css" media="screen" rel="stylesheet" type="text/css" /> <script type="text/javascript"> $('pre').each(function(i, e) { hljs.highlightBlock(e, "<span class='indent'> </span>", false) }); </script> <div class="col-lg-3 col-md-4 col-sm-5"> <div id="rightTop"> <div class="row"> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script>  <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="3862022848" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="row sidebar panel panel-default"> <div class="panel-heading font-bold"> Последний вопрос </div> <div class="m-b-sm m-t-sm clearfix"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://ru.voidcc.com/question/p-ajmzvmbg-u.html" target="_blank" title="Asp.Net MVC JsonResult метания «Корневой элемент отсутствует» ошибка в IIS"> Asp.Net MVC JsonResult метания «Корневой элемент отсутствует» ошибка в IIS </a> </li> <li class="side_article_list_item"> 2. <a href="http://ru.voidcc.com/question/p-nkvpmxxj-g.html" target="_blank" title="Ионный 2 - Идентификатор передачи от json к ребенку (подробности) страница"> Ионный 2 - Идентификатор передачи от json к ребенку (подробности) страница </a> </li> <li class="side_article_list_item"> 3. <a href="http://ru.voidcc.com/question/p-vsbiepyv-bn.html" target="_blank" title="Найти общие элементы из нескольких категорий в рамках dataframe?"> Найти общие элементы из нескольких категорий в рамках dataframe? </a> </li> <li class="side_article_list_item"> 4. <a href="http://ru.voidcc.com/question/p-svlilgtk-bhy.html" target="_blank" title="Доступные области для сообщений с богатыми слоями"> Доступные области для сообщений с богатыми слоями </a> </li> <li class="side_article_list_item"> 5. <a href="http://ru.voidcc.com/question/p-ozynytbr-bbz.html" target="_blank" title="Изменение количества графических процессоров при развертывании"> Изменение количества графических процессоров при развертывании </a> </li> <li class="side_article_list_item"> 6. <a href="http://ru.voidcc.com/question/p-fhoogxay-bcs.html" target="_blank" title="имеет проблемы с отображением сообщения об успешном php с ajax"> имеет проблемы с отображением сообщения об успешном php с ajax </a> </li> <li class="side_article_list_item"> 7. <a href="http://ru.voidcc.com/question/p-gmdgzeqt-bdw.html" target="_blank" title="Угловые столбцы обновления сетки ag-сетки * ngFor array"> Угловые столбцы обновления сетки ag-сетки * ngFor array </a> </li> <li class="side_article_list_item"> 8. <a href="http://ru.voidcc.com/question/p-qltnxdfg-bdm.html" target="_blank" title="Наследование как абстрактный базовый интерфейс и его реализации дает C2259"> Наследование как абстрактный базовый интерфейс и его реализации дает C2259 </a> </li> <li class="side_article_list_item"> 9. <a href="http://ru.voidcc.com/question/p-hregzdva-beq.html" target="_blank" title="Пытается запустить VS load test в Azure с драйвером Selenium Chrome и получить ошибку"> Пытается запустить VS load test в Azure с драйвером Selenium Chrome и получить ошибку </a> </li> <li class="side_article_list_item"> 10. <a href="http://ru.voidcc.com/question/p-daskxlwf-bmx.html" target="_blank" title="Нужно сокращенное состояние zipcode 75747 google map api?"> Нужно сокращенное состояние zipcode 75747 google map api? </a> </li> </ul> </div> </div> </div> <p class="article-nav-bar"></p> <div class="row sidebar article-nav"> <div class="row box_white visible-sm visible-md visible-lg margin-zero"> <div class="top"> <h3 class="title"><i class="glyphicon glyphicon-th-list"></i> Смежные вопросы</h3> </div> <div class="article-relative-content"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://ru.voidcc.com/question/p-bknqyfgk-bpw.html" target="_blank" title="Pretty print not working?"> Pretty print not working? </a> </li> <li class="side_article_list_item"> 2. <a href="http://ru.voidcc.com/question/p-pbqetdux-sx.html" target="_blank" title="Pretty Print/HTML Tidy для Google Web Toolkit (GWT)?"> Pretty Print/HTML Tidy для Google Web Toolkit (GWT)? </a> </li> <li class="side_article_list_item"> 3. <a href="http://ru.voidcc.com/question/p-csdptvku-zq.html" target="_blank" title="Pretty-print Java, XML, JavaScript, ... to HTML"> Pretty-print Java, XML, JavaScript, ... to HTML </a> </li> <li class="side_article_list_item"> 4. <a href="http://ru.voidcc.com/question/p-cpfjhrmi-pt.html" target="_blank" title="Pretty Print HTML в Ruby (или Shell)"> Pretty Print HTML в Ruby (или Shell) </a> </li> <li class="side_article_list_item"> 5. <a href="http://ru.voidcc.com/question/p-oalhbugp-bhv.html" target="_blank" title="Pretty print namedtuple"> Pretty print namedtuple </a> </li> <li class="side_article_list_item"> 6. <a href="http://ru.voidcc.com/question/p-szptsfyy-p.html" target="_blank" title="pretty print makefiles"> pretty print makefiles </a> </li> <li class="side_article_list_item"> 7. <a href="http://ru.voidcc.com/question/p-mkmkwguw-bqq.html" target="_blank" title="Pretty-print with awk?"> Pretty-print with awk? </a> </li> <li class="side_article_list_item"> 8. <a href="http://ru.voidcc.com/question/p-duuyfzyz-uq.html" target="_blank" title="Coldfusion - XML Pretty Print"> Coldfusion - XML Pretty Print </a> </li> <li class="side_article_list_item"> 9. <a href="http://ru.voidcc.com/question/p-aebnhprb-ma.html" target="_blank" title="Pretty Print Excel Формулы?"> Pretty Print Excel Формулы? </a> </li> <li class="side_article_list_item"> 10. <a href="http://ru.voidcc.com/question/p-azctnugg-bne.html" target="_blank" title="JSON pretty print customization"> JSON pretty print customization </a> </li> </ul> </div> </div> </div> </div> </div> </div> </div>  <footer id="footer"> <div class="bg-simple lt"> <div class="container"> <div class="row padder-v m-t"> <div class="col-xs-8"> <ul class="list-inline"> <li><a href="http://ru.voidcc.com/contact">Свяжитесь с нами</a></li> <li>© 2020 RU.VOIDCC.COM</li> <li><a rel="nofollow" href="https://beian.miit.gov.cn/" target="_blank">沪ICP备13005482号-13</a></li> <li><script type="text/javascript" src="https://s9.cnzz.com/z_stat.php?id=1280098168&web_id=1280098168"></script></li> <li><a href="http://cn.voidcc.com/" target="_blank" title="程序问答园区">简体中文</a></li> <li><a href="http://hk.voidcc.com/" target="_blank" title="程序問答園區">繁體中文</a></li> <li><a href="http://ru.voidcc.com/" target="_blank" title="поле вопросов и ответов">Русский</a></li> <li><a href="http://de.voidcc.com/" target="_blank" title="Frage - und - antwort - Park">Deutsch</a></li> <li><a href="http://es.voidcc.com/" target="_blank" title="Preguntas y respuestas">Español</a></li> <li><a href="http://hi.voidcc.com/" target="_blank" title="कार्यक्रम प्रश्न और उत्तर पार्क">हिन्दी</a></li> <li><a href="http://it.voidcc.com/" target="_blank" title="IL Programma di chiedere Park">Italiano</a></li> <li><a href="http://ja.voidcc.com/" target="_blank" title="プログラム問答園区">日本語</a></li> <li><a href="http://ko.voidcc.com/" target="_blank" title="프로그램 문답 단지">한국어</a></li> <li><a href="http://pl.voidcc.com/" target="_blank" title="program o park">Polski</a></li> <li><a href="http://tr.voidcc.com/" target="_blank" title="Program soru ve cevap parkı">Türkçe</a></li> <li><a href="http://vi.voidcc.com/" target="_blank" title="Đáp ứng viên">Tiếng Việt</a></li> <li><a href="http://fr.voidcc.com/" target="_blank" title="Programme interrogation Park">Française</a></li> </ul> </div> </div> </div> </div> </div> </footer>  <script async src="https://www.googletagmanager.com/gtag/js?id=UA-77509369-5"></script> <script> window.dataLayer = window.dataLayer || []; function gtag() { dataLayer.push(arguments); } gtag('js', new Date()); gtag('config', 'UA-77509369-5'); </script> <script> var _hmt = _hmt || []; (function () { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?67d4731349f0b00136755b80364ce381"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> </body> </html>