2012-02-23 2 views
0

Использование DomDocument для извлечения RSS-каналов, но столкнулся с нечетной проблемой. Если я возьму некоторый RSS-канал, например, http://rss.slashdot.org/Slashdot/slashdot, он отлично работает. Тем не менее, RSS-канал, который я пытаюсь разобрать, дает мне вопросы: http://www.ryanhache.com/feedDOMDocument :: getElementsByTagName не захватывает канал в PHP

Кажется, что не удается найти тег канала, а затем пропустить его. Функции, которые я унаследовал, следующие и вызывается с помощью RSS_Retrieve ($ url). Чего мне не хватает в этих функциях или что-то не так с подачей, которую я вытягиваю?

function RSS_Tags($item, $type) 
{ 
    $y = array(); 
    $tnl = $item->getElementsByTagName("title"); 
    $tnl = $tnl->item(0); 
    $title = $tnl->firstChild->textContent; 

    $tnl = $item->getElementsByTagName("link"); 
    $tnl = $tnl->item(0); 
    $link = $tnl->firstChild->textContent; 

    $tnl = $item->getElementsByTagName("pubDate"); 
    $tnl = $tnl->item(0); 
    $date = $tnl->firstChild->textContent; 

    $tnl = $item->getElementsByTagName("description"); 
    $tnl = $tnl->item(0); 
    $description = $tnl->firstChild->textContent; 

    $y["title"] = $title; 
    $y["link"] = $link; 
    $y["date"] = $date; 
    $y["description"] = $description; 
    $y["type"] = $type; 

    return $y; 
} 

function RSS_Channel($channel) 
{ 
    global $RSS_Content; 

    $items = $channel->getElementsByTagName("item"); 

    // Processing channel 

    $y = RSS_Tags($channel, 0);  // get description of channel, type 0 
    array_push($RSS_Content, $y); 

    // Processing articles 

    foreach($items as $item) 
    { 
     $y = RSS_Tags($item, 1); // get description of article, type 1 
     array_push($RSS_Content, $y); 
    } 
} 

function RSS_Retrieve($url) 
{ 
    global $RSS_Content; 

    $doc = new DOMDocument(); 
    $doc->load($url); 

    $channels = $doc->getElementsByTagName("channel"); 

    $RSS_Content = array(); 

    foreach($channels as $channel) 
    { 
     RSS_Channel($channel); 
    } 

} 
+0

Ваш URL-адрес 'http: // www.ryanhace.com/feed', по-видимому, равен 404? –

+0

Бах неправильно указал URL: http://www.ryanhache.com/feed – Jeff

+0

Кажется, здесь. Каков ваш фактический результат и ваш ожидаемый результат? –

ответ

1

Ваш код, похоже, работает, но задача может быть выполнена гораздо проще и без использования глобальной переменной.

function RSS_Tags($node, $map, $type) { 
    $item = array(); 
    foreach ($map as $elem=>$key) { 
     $item[$key] = (string) $node->{$elem}; 
    } 
    $item['type'] = $type; 
    return $item; 
} 

function RSS_Retrieve($url) { 
    $rss = simplexml_load_file($url); 
    $elements = array('title'=>'title', 'link'=>'link', 
     'pubDate'=>'date', 'description'=>'description'); 
    $feed = array(); 
    foreach ($rss->channel as $channel) { 
     $feed[] = RSS_Tags($channel, $elements, 0); 
     foreach ($channel->item as $item) { 
      $feed[] = RSS_Tags($item, $elements, 1); 
     } 
    } 
    return $feed; 
} 

$url = 'http://www.ryanhache.com/feed'; 
$RSS_Content = RSS_Retrieve($url); 
Смежные вопросы