2016-09-15 1 views
0

Я не знаю, что с этим делать, и я, вероятно, собираюсь получить некоторые голоса.Я хочу получить определенные URL из этого документа с помощью искателя php

У меня есть веб-страницу, подобную этой:

<li class="specific-class"> 
    <a href="http://unknown-url.com">Unknown Link</a> 
</li> 

Я хочу, чтобы сканировать страницу, заполненную несколькими другими элементами, я не заинтересован в получении.

Я хочу получить только атрибут href в привязном теге, в пределах элемента li и ничего больше. После чего я буду потом по ссылке и получить другую веб-страницу, которая имеет что-то вроде этого:

<h1 class="specific-class">Blah Blah Blah</h1> 

Так что в конце всего этого, я буду получать все, что в h1 элемент:

Blah Blah Blah 

Если бы вы, ребята, могли помочь мне обойти это, я бы очень признателен. Кроме того, любой API будет хорошо.

У меня есть этот кусок кода, который получает атрибуты от элемента, но я не смог получить его для обхода элементов, найденных в определенном элементе.

<?php 
include_once('simple_html_dom.php'); 
$target_url = "https://www.google.com/"; 
$html = new simple_html_dom(); 
$html->load_file($target_url); 
foreach($html->find('a') as $link){ 
    echo $link->href."<br>"; 

} 

?> 
+0

Предоставьте все, что вы сделали до сих пор, чтобы мы могли предложить дальнейшие решения. – Sasikumar

+0

Я отредактировал вопрос. @Sasikumar –

ответ

-1

Прочтите о DOMDocument. Вы можете использовать методы: getElementsByTagName, getElementById и т. Д.

Смежные вопросы