Здесь причина, по которой некоторые веб-сайты не позволяют сканировать.
file_get_contents('http://www.akaar.org/')
Вы можете получить результат с веб-сайта, что означает, что сервер, на котором размещен этот веб-сайт, не настроен файловым сервером для блокировки запросов на обход.
file_get_contents('http://www.ptsda.org/')
В этом случае вы получите HTTP request failed! HTTP/1.1 403 ModSecurity
в качестве вывода, что означает, что сервер настроен с использованием межсетевого экрана, и вы не получите ответ. Узнайте больше о ModSecurity.
Вот решение, попробуйте использовать CURL вместо file_get_contents. Примечание. Это работа.
<?php
$curl_handle=curl_init();
curl_setopt($curl_handle, CURLOPT_URL,'http://www.ptsda.org/');
curl_setopt($curl_handle, CURLOPT_CONNECTTIMEOUT, 2);
curl_setopt($curl_handle, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($curl_handle, CURLOPT_USERAGENT, 'ptsda');
$query = curl_exec($curl_handle);
curl_close($curl_handle);
//print_r($query);
?>
Так что я понял, что на их сервере есть безопасность. Но у меня есть идея, есть ли способ сохранить файл и передать его моему поисковому роботу? : P –