Для получения данных, есть три уровня сложности:
file_get_contents($url); //easy
К сожалению, многие сайты не очень отзывчивы на правильный пользовательский агент. Здесь у вас есть два варианта. Он немного сложнее, чем другой. Промежуточное является Zend HTTP Client
$client = Zend_Http_Client(); //make sure to include Zend_Http, etc.
$client->setConfig($params); // params will include proper user agent
$client->setUri($aUrl);
$html = $client->request()->getBody();
Вариант три, которые Вы не могли бы даже рассмотреть, если вы действительно хотите, чтобы держать его больше сценариев, чем объектно-ориентированный, заключается в изучении РНР cURL functionality
Есть несколько PHP- родные способы доступа к данным HTML через объект DOM, но моим фаворитом является Simple HTML DOM Parser. Это очень похоже на навигацию DOM в стиле jQuery/CSS.
$domObject = new Simple_HTML_Dom($html);
foreach ($domobject->find('div#theDataYouWant p') as $sentence)
{
echo "<h3>{$sentence}</h3>";
}