2012-03-03 3 views
1

У меня проблема с разбором HTML с DOM в PHP. Я хочу получить значение href, но даю мне ошибку. Я хочу значение строки и значение href вместе в двухмерном массиве. Последняя строка в коде также дает ошибку. Есть идеи ? Выход, который я хочу, -
1, «http: // .....», Пользователь
2, «http: // .....», Server ... и т. Д. В 2D-массиве.Анализ HTML в PHP

<html> 
<body> 
    <table> 
     <tbody> 
      <tr> 
       <td>1 </td> 
       <td><a href="http://www.abcd.net"></a></td> 
       <td>User</td> 
      </tr> 
      <tr> 
       <td>2 </td> 
       <td><a href="http://www.def.net"></a></td> 
       <td>Server</td> 
      </tr> 
     </tbody> 
    </table> 
    </body> 
    </html> 

Вот PHP код

$resArr = array(); 

$dom = new domDocument; 
@$dom -> loadHTML(file_get_contents($link)); 
$dom -> preserveWhiteSpace = false; 

$linkt = $dom -> getElementsByTagName('table'); 
$linkt1 = $linkt -> item(2); 

//tr 
foreach ($linkt1 -> childNodes as $key => $tag){ 
    //td 
    foreach ($tag -> childNodes as $key1 => $tag1){ 

     foreach ($tag1 -> childNodes as $key2 => $tag2){ 
      echo $tag2->hasattribute('href'); 
         //Error Occur here ----Fatal error: Call to 
         //undefined method DOMText::hasattribute() in on line 38 
     } 
    } 
} 

$resArr[$i][0] = $tag -> childNodes -> item(0) -> nodeValue; 
$resArr[$i][3] = $tag -> childNodes -> item(3) -> nodeValue; 
$resArr[$i][1] = $tag1 -> childNodes -> item(1) -> 
    childNodes -> item(0) -> getAttribute('href'); //the same error as above 
+8

Если вы получаете сообщение об ошибке, * включают сообщение об ошибке в вашем вопросе *. – Amber

+3

Ваш ожидаемый результат тоже будет полезен. Мы не можем читать ваши мысли. –

+0

У вас есть контроль над HTML? Почему бы не исправить это на сусе и, следовательно, получить лучшую производительность? –

ответ

3

Я не знаю точно, что вывод, который вы хотите, но я уверен, что это проблема XPath. Что-то вроде этого?

// Your sample html is stored in $html as a string 
libxml_use_internal_errors(false); 
$dom = new DOMDocument(); 
$dom->loadHTML($html); 
libxml_use_internal_errors(true); 

$xp = new DOMXPath($dom); 

$rows = $xp->query('/html/body/table/tbody/tr'); 

$resArr = array(); 
foreach ($rows as $row) { 
    $resArr[] = array(
     $xp->evaluate('string(td[1])', $row), 
     $xp->evaluate('string(td[2]/a/@href)', $row), 
     $xp->evaluate('string(td[3])', $row), 
    ); 
} 

var_dump($resArr); 

Выход из этого кода:

array(2) { 
    [0]=> 
    array(3) { 
    [0]=> 
    string(2) "1 " 
    [1]=> 
    string(19) "http://www.abcd.net" 
    [2]=> 
    string(4) "User" 
    } 
    [1]=> 
    array(3) { 
    [0]=> 
    string(2) "2 " 
    [1]=> 
    string(18) "http://www.def.net" 
    [2]=> 
    string(6) "Server" 
    } 
} 
+0

Прекрасно работает для меня. См. Обновленный ответ. Вы получаете какие-либо ошибки? –

+0

Привет, Фрэнсис, Спасибо за обновление. Оно работает! – zhtway

+0

Рад, что он работает. Подумайте о принятии ответа, если он ответит на ваш вопрос. –

Смежные вопросы