2012-06-25 3 views
0

Я пытаюсь скрести некоторый конкретный текст веб-сайта, который Логин обеспеченного здесь учебник по этому с помощью локонов http://www.digeratimarketing.co.uk/2008/12/16/curl-page-scraping-script/Scrape особая область содержимого сайта с помощью Secure Логин

Но я не могу реализовать это в мой локоне коды здесь мой локон сценарий

$url = "http://aftabcurrency.com/login_script.php"; 

$ch = curl_init();  
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); 

curl_setopt($ch, CURLOPT_URL, $url); 
$cookie = 'cookies.txt'; 
$timeout = 30; 

curl_setopt ($ch, CURLOPT_FOLLOWLOCATION, 1); 
curl_setopt($ch, CURLOPT_TIMEOUT,   10); 
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout); 
curl_setopt($ch, CURLOPT_COOKIEJAR,  $cookie); 
curl_setopt($ch, CURLOPT_COOKIEFILE,  $cookie); 

curl_setopt ($ch, CURLOPT_POST, 1); 
curl_setopt ($ch,CURLOPT_POSTFIELDS,"user_name=user&user_password=pass&passcode=code");  

$result = curl_exec($ch); 
curl_close($ch); 
$source = $result; 
if(preg_match("/(CC3300\">)(.*?)(<\/font>)/is",$source,$found)){ 
echo $found[2]; 
}else{ 
echo "Text not found."; 
} 

, например, в aftabcurrency.com я только хочу лом только «Наши услуги Matters!» (этот текст меняется каждый день)

+0

Вам не нужно входить в систему, чтобы очистить «Наши услуги!». Он также показывается пользователям без регистрации, поэтому вы можете избавить вас от этой проблемы! –

+0

Я знаю, но это был всего лишь пример Я хочу скопировать текст внутри защищенной страницы входа – user1447187

ответ

1

что бы я делал, это «вырезать» текст между началом и началом ... в исходном тексте текст начинается с цвета текста 613A75 и с закрытием </font > тег .. здесь регулярное выражение решение:

$source = file_get_contents("http://aftabcurrency.com/index.php"); 
if(preg_match("/(613A75\">)(.*?)(<\/font>)/is",$source,$found)){ 
echo $found[2]; 
}else{ 
echo "Text not found."; 
} 

, если вы хотите сделать это с помощью текста внутри мемберке, добавьте мой источник здесь к источнику и замените $ источника = file_get_contents ... с $ источника = $ result

есть и другой способ сделать это, DomDocument и xpath или простые функции strpos/strstr/substr php.

+0

Я сделал, как вы упомянули, но я всегда получаю Текст не найден см. Код, который я редактировал выше, в исходном вопросе – user1447187

+0

Исходный код (текст), который я хочу извлечь, здесь http://tinypaste.com/45fa0bed – user1447187

+0

источник работает только для http://ftabcurrency.com/index.php и для текста «Наши вопросы обслуживания» - теперь вы предоставили мне новый исходный код с веб-сайта, что вы хотите получить там? – MilMike

Смежные вопросы