Я знаю, что этот вопрос рассматривался несколько раз, но ни одна из исправлений, похоже, не работает с моей конкретной проблемой. Я пытаюсь захватить любую страницу из http://www.lewmar.com, но некоторые из них как они блокируют все попытки. Мой последний сценарий выглядит следующим образом:cURL и get_file_contents заблокирован
function curl_get_contents($url)
{
$ch = curl_init();
$browser_id = "User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64; rv:45.0) Gecko/20100101 Firefox/45.0";
$ip = $_SERVER["SERVER_ADDR"];
curl_setopt($ch, CURLOPT_USERAGENT, $browser_id);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, TRUE);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_REFERER, $ip);
$headers = array();
$headers[] = 'Cache-Control: max-age=0';
$headers[] = 'Connection: keep-alive';
$headers[] = 'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8';
$headers[] = 'Accept-Language: en-US,en;q=0.5';
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$data = curl_exec($ch);
curl_close($ch);
return $data;
}
$url = 'http://www.lewmar.com';
$contents = curl_get_contents($url);
echo strlen($contents);
Я попытался повторить большинство заголовков и сайт не кажется, чтобы проверить на совместимость «JavaScript», но еще до сих пор не могут получить что-нибудь вернулся.
Кто-нибудь знает, как они могут распознавать cURL и блокировать.
Приветствия
http://stackoverflow.com/questions/34288640/testing-curl-the-code-not-working/34290456#34290456 – Andreas
Спасибо за предложение, но оно не работает на этом конкретном сайте. –