2012-03-30 3 views
0

Я пытаюсь загрузить эту веб-страницу http://www.realtor.com/search/searchresults.aspx?mlslid=120012971&source=web с помощью php file_get_contents или curl. Я использую этот код.php file_get_contents() не работает для всплывающего окна

<?php 

function get_contents($url) 
{ 
    $ch = curl_init(); 
    curl_setopt ($ch, CURLOPT_URL, $url); 
    curl_setopt ($ch, CURLOPT_HEADER, 0); 
    ob_start(); 
    curl_exec ($ch); 
    curl_close ($ch); 
    return ob_get_clean(); 
} 

$url = "http://www.realtor.com/search/searchresults.aspx?mlslid=120012971&source=web"; 

//$html = file_get_contents($url); 
$html = get_contents($url); 

echo $html; 
?> 

два дня назад оба процесса работали хорошо. но теперь есть всплывающее окно, которое создает проблему для загрузки этой страницы. Есть ли способ обойти всплывающее окно для загрузки оригинальной веб-страницы?

+0

FYI. Я считаю, что то, что вы здесь делаете, нарушает условия использования Realtor.com. Не говоря уже о том, что соскабливание всегда будет ломаться, когда они изменят разметку. Возможно, вам лучше использовать недвижимость api, например, предлагаемую trulia или zillow. –

ответ

0

Похоже, что доступ к веб-странице требует взаимодействия с веб-страницей. Чтобы сценарировать интерактивные веб-эксперименты с несколькими действиями, вам необходимо использовать инструмент автоматизации, такой как Selenium. Используя этот набор, вы можете создавать сценарии взаимодействия с приложениями DOM и JavaScript.

+0

Как я могу использовать селен для этого конкретного случая? – qmaruf

+0

Это совершенно другой вопрос. – buley

Смежные вопросы