2010-12-08 7 views
0

Я использую это PHP:PHP Curl, чтобы захватить конкретный HTML

<?php 

$curl_handle=curl_init(); 
curl_setopt($curl_handle,CURLOPT_URL,'http://www.notrly.com/jackbauer/'); 
curl_setopt($curl_handle,CURLOPT_CONNECTTIMEOUT,2); 
curl_setopt($curl_handle,CURLOPT_RETURNTRANSFER,1); 
$buffer = curl_exec($curl_handle); 
curl_close($curl_handle); 

if (empty($buffer)) 
{ 
    print "Not today"; 
} 
else 
{ 
    print $buffer; 
} 
?> 

Существует р тег с классом «фактом» в том, что я хочу, чтобы извлечь и отобразить! Как мне это сделать? Также против авторских прав, если я использую это, чтобы захватить кого-то еще HTML с сайта?

ответ

2

Если вы хотите использовать локон, а затем загрузить страницу и использовать DOM-парсер, как:

http://simplehtmldom.sourceforge.net/

Или вы могли бы просто сделать что-то вроде этого:

include_once('simple_html_dom.php'); 

$dom = file_get_html('http://www.notrly.com/jackbauer/'); 

foreach($dom->find("div.head div.fact p.fact") as $element) 
    die($element->innertext); 
+0

отлично, еще раз, что против какого-то авторского права> – benhowdle89 2010-12-08 22:32:00

+0

из того, что я могу видеть, нет авторских прав отображается на странице. Поэтому я предполагаю, что он общедоступен. – 2010-12-08 22:34:54

0

Берут посмотрите на strpos для поиска в строках ...

if (strpos($buffer, '<p class="fact">') !== FALSE) { 
    print "Yay"; 
} 
0

Я бы посмотрел парсеры HTML, упомянутые в ответе на этот вопрос question. Что касается вопросов авторского права, я думаю, что это будет зависеть от многих факторов, в том числе:

  • Что вы делаете с содержанием
  • Сколько контента вы используете
  • Что такое авторское право на сайте вы выскабливание
Смежные вопросы