У меня есть HTML каккак отделить выбранные теги содержимого HTML
<span class="address">
<h1>Dr. Maria Steffens</h1>
<h4>Institute of Medico</h4>
<h4></h4>
<h4></h4>
<p>Sta. Ana, strt PH-501</p>
<p>1062 Caracas</p>
<p>France</p>
<br>
<p>Telefon: +58-457-2889567</p>
<p><a href="mailto:[email protected]">[email protected]</a></p>
<p><a href="http://">www.mysite.com</a></p>
</span>
Теперь я хочу, чтобы отделить каждую метку, как
<h1>Dr. Maria Steffens</h1>
или возникновение
<h4></h4> tag
I попробовал
$html = new DOMDocument();
@$html->loadHtmlFile('http://www.sitetofetch.com');
$xpath = new DOMXPath($html);
$nodelist = $xpath->query("//*[@class='address']");
foreach ($nodelist as $n){
$newhtml = $html->saveHtml($n)."\n";
$newhtml = htmlentities($newhtml);
$items = $html->getElementsByTagName('h1');
}
, но он не работает должным образом,
Как я могу сделать это.
Можете ли вы описать это немного дальше, что вы хотите достичь? Это пока не очень понятно. –
У меня есть scraped html ...., теперь любой тег, который я выбираю как
xyz
. это даст мне «xyz». и если я выберуpqr
. это даст мне «pqr». – AdasRegex не является предпочтительным для разбора html. [Этот вопрос] (http://stackoverflow.com/questions/13458133/php-parse-html-tags), например, получает те теги из html-документа через getElementsByTagName(). – LukStorms