У меня есть несколько ссылок, некоторые на rapidshare и некоторые другие загрузки хостов. Я попытался получить исходный код с curl и file_get_contents, а затем искать «Deleted» или так, но я не смог получить исходный код на некоторых хостах.Получение html исходного кода в php
На некоторых хостах работает curl, а на других file_get_contents работает, но большинство не вернет исходный код.
Вот мой код для завитка:
function curl_download($Url){
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $Url);
$agent = "Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)";
curl_setopt($ch, CURLOPT_USERAGENT, $agent);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch,CURLOPT_VERBOSE,false);
curl_setopt($ch,CURLOPT_SSL_VERIFYPEER, FALSE);
curl_setopt($ch,CURLOPT_SSLVERSION,3);
curl_setopt($ch,CURLOPT_SSL_VERIFYHOST, FALSE);
curl_setopt($ch, CURLOPT_TIMEOUT, 0);
curl_setopt($ch, CURLOPT_FRESH_CONNECT, 1);
curl_setopt($ch, CURLOPT_FORBID_REUSE, 1);
$output = curl_exec($ch);
curl_close($ch);
return $output;
До сих пор не работает. Я получаю исходный код, но он не похож на исходный код, который я получаю, если я открою сайт и посмотрю на исходный код, это другое. Я получаю это до исходного кода: HTTP/1.1 200 OK Cache-Control: private Content-Length: 7036 Content-Type: text/html; charset = utf-8 Сервер: Microsoft-IIS/7.5 X-AspNet-Version: 2.0.50727 Set-Cookie: – user1104615
Это HTTP-заголовки. – ceejayoz