2011-10-17 2 views
0

У меня есть небольшая проблема с шаблоном для получения заголовка удаленной страницы, в то время как тот же шаблон дает результат, вот образец.получение заголовка удаленной страницы

preg_match_all('|<title>(.*)</title>|U',$this->data,$title); 

для других url и дающий результаты. Хотя после возвращения Пустой массив

preg_match_all('|<title>(.*)</title>|U', $valD, $title); 

может любой на сказать мне какие-либо проблемы с этими линиями.

Где $ this-> data и $ valD содержит содержимое двух разных URL-адресов для разных серверов.

Пожалуйста, помогите мне. Я попробовал его решить, но я не смог его решить. Итак, я прошу вас всех рассказать мне о моих недостатках.

спасибо.

+0

Посмотрите на [этот вопрос] (http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags). Используйте HTML-парсер для преобразования документа в DOM, а затем используйте методы обхода DOM или XPath. –

+0

Вы инициализировали '$ title' пустым массивом? Вы включили отчет об ошибках ('error_reporting (E_ALL | E_NOTICE)')? – knittl

+0

Проблема должна заключаться в том, что ваше регулярное выражение не подходит для одного сайта. Можете ли вы опубликовать фрагмент HTML, который не соответствует, который включает в себя тег для этой страницы? – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/862594/">nickb</a></span> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> </div> <div class="answer-title"> <span class="text-logo margin-top-sm">A</span> <h2 class="title h4">ответ</h2> </div> <div class="item-description text-md markdown-body margin-bottom-40 voidso"> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">2<i class="fa fa-thumbs-up"></i></span> <i class="fa fa-check fa-2x"></i> </div> <div class="post-offset"> <div class="answer fmt"> <p>Если вы соответствуете HTML, тогда вы также ожидаете, что теги в верхнем регистре. Добавьте флаг <code class="prettyprint-override">|i</code>.</p> <p>Идентификатор названия может также содержать символы новой строки, поэтому также должен присутствовать флаг <code class="prettyprint-override">|s</code>.</p> <pre><code class="prettyprint-override">preg_match_all('|<title>(.*)</title>|Uis', ... </code></pre> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/7790680">источник</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2011-10-17 07:38:38</span> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/345031/">mario</a></span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div> <!-- comments --> <div class="comments"> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">Могу ли я поставить i, s, U после '|'? И спасибо, что он работал. – <span class="text-secondary"> <small> <span></span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">и что делать, если: <title ></ title>? – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/220060/">nalply</a></span> <span></span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">@nalply: Это просто не соответствует. – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/345031/">mario</a></span> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> <div> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="4319274062" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">0<i class="fa fa-thumbs-up"></i></span> </div> <div class="post-offset"> <div class="answer fmt"> <p>Может быть, есть разрыв строки в тег заголовка, такие как это:</p> <pre><code class="prettyprint-override"><title> The page title </title> </code></pre> <p>Попробуйте</p> <pre><code class="prettyprint-override">preg_match_all('|<title>[:space:]*(.*)[:space:]*</title>|U', $valD, $title); </code></pre> <p>вместо этого.</p> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/7790708">источник</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2011-10-17 07:42:22</span> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/288568/">Alex</a></span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div> <!-- comments --> <div class="comments"> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">и что делать, если кто-то <Title> вместо <title>? :-) – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/220060/">nalply</a></span> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> </div> <div class="clearfix"> </div> <div class="relative-box"> <div class="relative">Смежные вопросы</div> <ul class="relative_list"> <li> 1. <a href="http://ru.voidcc.com/question/p-gepsigmu-dx.html" target="_blank" title="Получение заголовка страницы в PHP"> Получение заголовка страницы в PHP </a> </li> <li> 2. <a href="http://ru.voidcc.com/question/p-hxuytila-wh.html" target="_blank" title="Получение заголовка страницы в PhantomJS"> Получение заголовка страницы в PhantomJS </a> </li> <li> 3. <a href="http://ru.voidcc.com/question/p-yxocguow-ya.html" target="_blank" title="Получение заголовка веб-страницы regex"> Получение заголовка веб-страницы regex </a> </li> <li> 4. <a href="http://ru.voidcc.com/question/p-wknemjdv-td.html" target="_blank" title="Получение заголовка страницы в iFrame"> Получение заголовка страницы в iFrame </a> </li> <li> 5. <a href="http://ru.voidcc.com/question/p-rcocixaw-bhu.html" target="_blank" title="Получение заголовка страницы с Ruby"> Получение заголовка страницы с Ruby </a> </li> <li> 6. <a href="http://ru.voidcc.com/question/p-wvvyzwby-bhg.html" target="_blank" title="Получение заголовка страницы с главной страницы"> Получение заголовка страницы с главной страницы </a> </li> <li> 7. <a href="http://ru.voidcc.com/question/p-qbuxpvep-baz.html" target="_blank" title="Получение заголовка новой страницы с .load()"> Получение заголовка новой страницы с .load() </a> </li> <li> 8. <a href="http://ru.voidcc.com/question/p-doklcslo-rc.html" target="_blank" title="Получение заголовка страницы и ее отображение - JS"> Получение заголовка страницы и ее отображение - JS </a> </li> <li> 9. <a href="http://ru.voidcc.com/question/p-wyzujwrc-ku.html" target="_blank" title="Получение заголовка страницы из URL в Angular.js"> Получение заголовка страницы из URL в Angular.js </a> </li> <li> 10. <a href="http://ru.voidcc.com/question/p-wpytrbwt-bny.html" target="_blank" title="Получение удаленной записи?"> Получение удаленной записи? </a> </li> <li> 11. <a href="http://ru.voidcc.com/question/p-nlkfpcii-bmo.html" target="_blank" title="Проверка наличия удаленной/внешней веб-страницы и получение кода состояния"> Проверка наличия удаленной/внешней веб-страницы и получение кода состояния </a> </li> <li> 12. <a href="http://ru.voidcc.com/question/p-qelqlpok-zc.html" target="_blank" title="Используйте HTTPWebRequest, чтобы получить название удаленной страницы"> Используйте HTTPWebRequest, чтобы получить название удаленной страницы </a> </li> <li> 13. <a href="http://ru.voidcc.com/question/p-kkuohojl-ew.html" target="_blank" title="PHP Возврат содержимого удаленной страницы"> PHP Возврат содержимого удаленной страницы </a> </li> <li> 14. <a href="http://ru.voidcc.com/question/p-pcocwvtt-bnh.html" target="_blank" title="Как выбрать название удаленной страницы"> Как выбрать название удаленной страницы </a> </li> <li> 15. <a href="http://ru.voidcc.com/question/p-hetajemf-bks.html" target="_blank" title="Выбор тега стиля удаленной страницы?"> Выбор тега стиля удаленной страницы? </a> </li> <li> 16. <a href="http://ru.voidcc.com/question/p-drcwkdjl-bnx.html" target="_blank" title="Расширение ios и получение заголовка url и скриншот страницы"> Расширение ios и получение заголовка url и скриншот страницы </a> </li> <li> 17. <a href="http://ru.voidcc.com/question/p-dmijqdie-bro.html" target="_blank" title="Получение заголовка страницы обсуждения с использованием mediawiki API"> Получение заголовка страницы обсуждения с использованием mediawiki API </a> </li> <li> 18. <a href="http://ru.voidcc.com/question/p-mqhqubsg-bgr.html" target="_blank" title="Получение заголовка веб-страницы с указанием URL-адреса"> Получение заголовка веб-страницы с указанием URL-адреса </a> </li> <li> 19. <a href="http://ru.voidcc.com/question/p-fnnhjxcm-qb.html" target="_blank" title="Получение «Не удается изменить информацию заголовка» от страницы входа"> Получение «Не удается изменить информацию заголовка» от страницы входа </a> </li> <li> 20. <a href="http://ru.voidcc.com/question/p-vuwwuiay-ty.html" target="_blank" title="Страницы Magento CMS - получение заголовка из ключа/идентификатора URL?"> Страницы Magento CMS - получение заголовка из ключа/идентификатора URL? </a> </li> <li> 21. <a href="http://ru.voidcc.com/question/p-dtuhxkif-bme.html" target="_blank" title="получение заголовка страницы с помощью простого html dom?"> получение заголовка страницы с помощью простого html dom? </a> </li> <li> 22. <a href="http://ru.voidcc.com/question/p-xzlidwuk-pr.html" target="_blank" title="Получение информации заголовка внутри JavaScript"> Получение информации заголовка внутри JavaScript </a> </li> <li> 23. <a href="http://ru.voidcc.com/question/p-qjqxrxie-bew.html" target="_blank" title="PHP получение заголовка XML-файла"> PHP получение заголовка XML-файла </a> </li> <li> 24. <a href="http://ru.voidcc.com/question/p-dncxnqle-qs.html" target="_blank" title="Получение кода ответа заголовка"> Получение кода ответа заголовка </a> </li> <li> 25. <a href="http://ru.voidcc.com/question/p-ddadyqch-vp.html" target="_blank" title="Получение изображения из заголовка"> Получение изображения из заголовка </a> </li> <li> 26. <a href="http://ru.voidcc.com/question/p-mogxqrgr-wd.html" target="_blank" title="Получение заголовка окна?"> Получение заголовка окна? </a> </li> <li> 27. <a href="http://ru.voidcc.com/question/p-snsvaxln-zh.html" target="_blank" title="Получение заголовка сообщения"> Получение заголовка сообщения </a> </li> <li> 28. <a href="http://ru.voidcc.com/question/p-fkdozbli-bx.html" target="_blank" title="Получение двойного пользовательского заголовка"> Получение двойного пользовательского заголовка </a> </li> <li> 29. <a href="http://ru.voidcc.com/question/p-wtugyloq-ga.html" target="_blank" title="Получение заголовка из API"> Получение заголовка из API </a> </li> <li> 30. <a href="http://ru.voidcc.com/question/p-xbxjtgcs-bmg.html" target="_blank" title="Получение заголовка google chrome"> Получение заголовка google chrome </a> </li> </ul> </div> <div> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-format="autorelaxed" data-ad-client="ca-pub-6208739752673518" data-ad-slot="3534119089"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="padding-top-10"></div> </div> </div> <script type="text/javascript" src="http://img2.voidcc.com/voidso/script/side.js?t=1652515422009"></script> <script type="text/javascript" src="http://img2.voidcc.com/voidso/plugin/highlight/highlight.pack.js"></script> <link href="http://img2.voidcc.com/voidso/plugin/highlight/styles/docco.css" media="screen" rel="stylesheet" type="text/css" /> <script type="text/javascript"> $('pre').each(function(i, e) { hljs.highlightBlock(e, "<span class='indent'> </span>", false) }); </script> <div class="col-lg-3 col-md-4 col-sm-5"> <div id="rightTop"> <div class="row"> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <!-- VOIDCC问答侧边栏广告 --> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="3862022848" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="row sidebar panel panel-default"> <div class="panel-heading font-bold"> Последний вопрос </div> <div class="m-b-sm m-t-sm clearfix"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://ru.voidcc.com/question/p-vyfepcyu-nx.html" target="_blank" title="Отключить/включить перехватчик во время выполнения"> Отключить/включить перехватчик во время выполнения </a> </li> <li class="side_article_list_item"> 2. <a href="http://ru.voidcc.com/question/p-eolenjxw-mx.html" target="_blank" title="Угловой 2 «Невозможно сопоставить любые маршруты» по именованной розетке"> Угловой 2 «Невозможно сопоставить любые маршруты» по именованной розетке </a> </li> <li class="side_article_list_item"> 3. <a href="http://ru.voidcc.com/question/p-fmakmlcx-mg.html" target="_blank" title="Чтение почты SMTP в одной строке"> Чтение почты SMTP в одной строке </a> </li> <li class="side_article_list_item"> 4. <a href="http://ru.voidcc.com/question/p-qbnfmlkp-kc.html" target="_blank" title="Сортировка столбцов таблицы на основе значения NULL"> Сортировка столбцов таблицы на основе значения NULL </a> </li> <li class="side_article_list_item"> 5. <a href="http://ru.voidcc.com/question/p-vdkpmjxt-ht.html" target="_blank" title="Как установить цвет Backgroud панели в transperent"> Как установить цвет Backgroud панели в transperent </a> </li> <li class="side_article_list_item"> 6. <a href="http://ru.voidcc.com/question/p-ejkdpqvu-eu.html" target="_blank" title="Не удается получить доступ к контроллеру angularjs"> Не удается получить доступ к контроллеру angularjs </a> </li> <li class="side_article_list_item"> 7. <a href="http://ru.voidcc.com/question/p-dahqgqap-gn.html" target="_blank" title="Как я могу вставить свои данные PHP с несколькими aray"> Как я могу вставить свои данные PHP с несколькими aray </a> </li> <li class="side_article_list_item"> 8. <a href="http://ru.voidcc.com/question/p-kqvvocui-ca.html" target="_blank" title="Как перетащить UITableView, который может автоматически расширяться, чтобы заполнить весь экран в Xcode 8.2.1"> Как перетащить UITableView, который может автоматически расширяться, чтобы заполнить весь экран в Xcode 8.2.1 </a> </li> <li class="side_article_list_item"> 9. <a href="http://ru.voidcc.com/question/p-hweojiiq-dv.html" target="_blank" title="AppCode не может работать на симуляторе и устройстве"> AppCode не может работать на симуляторе и устройстве </a> </li> <li class="side_article_list_item"> 10. <a href="http://ru.voidcc.com/question/p-tzfnpkcg-bu.html" target="_blank" title="триггер Page_Load управления меню из iframe страницы"> триггер Page_Load управления меню из iframe страницы </a> </li> </ul> </div> </div> </div> <p class="article-nav-bar"></p> <div class="row sidebar article-nav"> <div class="row box_white visible-sm visible-md visible-lg margin-zero"> <div class="top"> <h3 class="title"><i class="glyphicon glyphicon-th-list"></i> Смежные вопросы</h3> </div> <div class="article-relative-content"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://ru.voidcc.com/question/p-gepsigmu-dx.html" target="_blank" title="Получение заголовка страницы в PHP"> Получение заголовка страницы в PHP </a> </li> <li class="side_article_list_item"> 2. <a href="http://ru.voidcc.com/question/p-hxuytila-wh.html" target="_blank" title="Получение заголовка страницы в PhantomJS"> Получение заголовка страницы в PhantomJS </a> </li> <li class="side_article_list_item"> 3. <a href="http://ru.voidcc.com/question/p-yxocguow-ya.html" target="_blank" title="Получение заголовка веб-страницы regex"> Получение заголовка веб-страницы regex </a> </li> <li class="side_article_list_item"> 4. <a href="http://ru.voidcc.com/question/p-wknemjdv-td.html" target="_blank" title="Получение заголовка страницы в iFrame"> Получение заголовка страницы в iFrame </a> </li> <li class="side_article_list_item"> 5. <a href="http://ru.voidcc.com/question/p-rcocixaw-bhu.html" target="_blank" title="Получение заголовка страницы с Ruby"> Получение заголовка страницы с Ruby </a> </li> <li class="side_article_list_item"> 6. <a href="http://ru.voidcc.com/question/p-wvvyzwby-bhg.html" target="_blank" title="Получение заголовка страницы с главной страницы"> Получение заголовка страницы с главной страницы </a> </li> <li class="side_article_list_item"> 7. <a href="http://ru.voidcc.com/question/p-qbuxpvep-baz.html" target="_blank" title="Получение заголовка новой страницы с .load()"> Получение заголовка новой страницы с .load() </a> </li> <li class="side_article_list_item"> 8. <a href="http://ru.voidcc.com/question/p-doklcslo-rc.html" target="_blank" title="Получение заголовка страницы и ее отображение - JS"> Получение заголовка страницы и ее отображение - JS </a> </li> <li class="side_article_list_item"> 9. <a href="http://ru.voidcc.com/question/p-wyzujwrc-ku.html" target="_blank" title="Получение заголовка страницы из URL в Angular.js"> Получение заголовка страницы из URL в Angular.js </a> </li> <li class="side_article_list_item"> 10. <a href="http://ru.voidcc.com/question/p-wpytrbwt-bny.html" target="_blank" title="Получение удаленной записи?"> Получение удаленной записи? </a> </li> </ul> </div> </div> </div> </div> </div> </div> </div><!-- wrap end--> <!-- footer --> <footer id="footer"> <div class="bg-simple lt"> <div class="container"> <div class="row padder-v m-t"> <div class="col-xs-8"> <ul class="list-inline"> <li><a href="http://ru.voidcc.com/contact">Свяжитесь с нами</a></li> <li>© 2020 RU.VOIDCC.COM</li> <li><a rel="nofollow" href="https://beian.miit.gov.cn/" target="_blank">沪ICP备13005482号-13</a></li> <li><script type="text/javascript" src="https://s9.cnzz.com/z_stat.php?id=1280098168&web_id=1280098168"></script></li> <li><a href="http://cn.voidcc.com/" target="_blank" title="程序问答园区">简体中文</a></li> <li><a href="http://hk.voidcc.com/" target="_blank" title="程序問答園區">繁體中文</a></li> <li><a href="http://ru.voidcc.com/" target="_blank" title="поле вопросов и ответов">Русский</a></li> <li><a href="http://de.voidcc.com/" target="_blank" title="Frage - und - antwort - Park">Deutsch</a></li> <li><a href="http://es.voidcc.com/" target="_blank" title="Preguntas y respuestas">Español</a></li> <li><a href="http://hi.voidcc.com/" target="_blank" title="कार्यक्रम प्रश्न और उत्तर पार्क">हिन्दी</a></li> <li><a href="http://it.voidcc.com/" target="_blank" title="IL Programma di chiedere Park">Italiano</a></li> <li><a href="http://ja.voidcc.com/" target="_blank" title="プログラム問答園区">日本語</a></li> <li><a href="http://ko.voidcc.com/" target="_blank" title="프로그램 문답 단지">한국어</a></li> <li><a href="http://pl.voidcc.com/" target="_blank" title="program o park">Polski</a></li> <li><a href="http://tr.voidcc.com/" target="_blank" title="Program soru ve cevap parkı">Türkçe</a></li> <li><a href="http://vi.voidcc.com/" target="_blank" title="Đáp ứng viên">Tiếng Việt</a></li> <li><a href="http://fr.voidcc.com/" target="_blank" title="Programme interrogation Park">Française</a></li> </ul> </div> </div> </div> </div> </div> </footer> <!-- / footer --> <script async src="https://www.googletagmanager.com/gtag/js?id=UA-77509369-5"></script> <script> window.dataLayer = window.dataLayer || []; function gtag() { dataLayer.push(arguments); } gtag('js', new Date()); gtag('config', 'UA-77509369-5'); </script> <script> var _hmt = _hmt || []; (function () { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?67d4731349f0b00136755b80364ce381"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> </body> </html>