Я хотел бы очистить содержимое этого Google search result page с помощью curl. Я пытался настроить разные пользовательские агенты и устанавливать другие параметры, но я просто не могу получить содержимое этой страницы, так как меня часто перенаправляют или я получаю сообщение об ошибке страницы.Как получить содержимое страницы с помощью cURL?
Я считаю, что это связано с тем, что строка запроса закодирована где-то, но я действительно не уверен, как обойти это.
//$url is the same as the link above
$ch = curl_init();
$user_agent='Mozilla/5.0 (Windows NT 6.1; rv:8.0) Gecko/20100101 Firefox/8.0'
curl_setopt ($ch, CURLOPT_URL, $url);
curl_setopt ($ch, CURLOPT_USERAGENT, $user_agent);
curl_setopt ($ch, CURLOPT_HEADER, 0);
curl_setopt ($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch,CURLOPT_CONNECTTIMEOUT,120);
curl_setopt ($ch,CURLOPT_TIMEOUT,120);
curl_setopt ($ch,CURLOPT_MAXREDIRS,10);
curl_setopt ($ch,CURLOPT_COOKIEFILE,"cookie.txt");
curl_setopt ($ch,CURLOPT_COOKIEJAR,"cookie.txt");
echo curl_exec ($ch);
Что мне нужно сделать, чтобы получить мой PHP код, чтобы показать точное содержание страницы, как хотелось бы видеть на моем браузере? Что мне не хватает? Может ли кто-нибудь указать мне правильное направление?
Я видел похожие вопросы на SO, но ни один из них не мог ответить мне.
EDIT:
Я попытался просто открыть ссылку с помощью Selenium WebDriver, что дает те же результаты, как завиток. Я все еще думаю, что это связано с тем, что в строке запроса есть специальные символы, которые где-то запутываются.
$ output = curl_exec ($ ch); echo $ output; –
@BojanKovacevic Я редактировал код, чтобы показать, что я делаю 'echo curl_exec ($ ch);' Я получаю страницу, но не та, которую я запрашиваю. – 7usam
Вы не можете очистить результаты поиска Google - результаты Googles являются их основным IP-адресом, они не собираются его отдать! - независимо от того, что вы делаете с вашим кодом, вы столкнетесь со многими (МНОГО!) другими проблемами, в меньшей степени из которых будет включен черный список. Если вы пытаетесь отслеживать результаты поиска или SEO или аналогичные, используйте надлежащее программное обеспечение для отслеживания, такое как http://www.seomoz.org/ – LuckySpoon