Название вопроса говорит обо всем, после нескольких попыток Google и нескольких дней возиться с кодом, я не могу понять, как загрузить простой текст веб-страницы.Загрузите только текстовую страницу
Использование strip_tags();
по-прежнему оставляет JavaScript
и CSS
и пытается очистить его регулярным выражением, также вызывает проблемы.
Есть ли какой-либо (простой или сложный) способ загрузить веб-страницу (например, статью в Википедии) в текстовом формате с использованием PHP?
Я загрузил страницу, используя РНР file_get_contents();
, как здесь:
$homepage = file_get_contents('http://www.example.com/');
Как я уже сказал, я попытался с помощью strip_tags();
т.д., но я не могу получить простой текст.
Я попытался использовать: http://millkencode.googlecode.com/svn/trunk/htmlxtractor/ContentExtractor.php, чтобы получить основной контент, но он не работает.
Пожалуйста, добавьте ваш код попробовал ... – ops
@yonessafari подожди, Лемм получить его и отправить его. – user115422
Как вы загружали содержимое страницы? –