Я стараюсь получать новости с сайта
, но я ничего не могу с содержанием веб-страницы извлечения. Когда я применяю file_get_contents()
Я получаю строку, для которой другая функция не работает. Первоначально я пытаюсь использовать file_get_html()
от simple_html_dom.php
, но тогда другие функции из этого источника не распознают элементы в полученном DOM.
О другой функции:
<?php
$content = file_get_contents('http://www.science-support.ru/news.html'); //normal page
$content = substr($content,20); //strange characters
$content_arr = explode('div id="box3"' , $content); //doesn't work
echo $content;
echo $content_arr[0];
?>
После подстрока(), я получаю что-то вроде
" <�/tr> <�/table> <�/div> <�div id="box3"><�!-- InstanceBeginEditable name="page-content" --> <�h4 class="yellow">14.11.2014 />2>AB8 $>=40/<�/h4> <�p>1JO2;O=K @57C;LB0BK :>=:[email protected] =0 [email protected]=85 ?>8A:>2KE [email protected]=B>2 ?> @>[email protected]<<5 =0CG=>-B5E=8G5A:>9 <>[email protected]=870F88 8 ?>2KH5=8N :20;8D8:0F88 <>;>4KE CG5=KE >AA88 2014-2015 33.<�a href="news/news2014-nota-res.html" class="txt" >?>[email protected]>1=55<�/a><�/p>"
Как я могу извлечь читаемый контент? Благодаря
'другие функции дон «Работайте», какую функцию? Как насчет этого не работает? – chris85
Что вы получаете? – foxbeefly
http://stackoverflow.com/help/how-to-ask – swalog