Я использую Simple html dom для очистки веб-сайта. Проблема, с которой я столкнулся, заключается в том, что есть текст, расположенный вне любого конкретного элемента. Единственный элемент, который, кажется, внутри, - <div id="content">
.Получить текст за пределами элементов
<div id="content">
<div class="image-wrap"></div>
<div class="gallery-container"></div>
<h3 class="name">Here is the Heading</h3>
All the text I want is located here !!!
<p> </p>
<div class="snapshot"></div>
</div>
Я предполагаю, что веб-мастер перепутались и текст должен быть на самом деле внутри <p>
тегов.
Я попытался использовать этот код, приведенный ниже, однако он просто не будет извлекать текст:
$t = $scrape->find("div#content text",0);
if ($t != null){
$text = trim($t->plaintext);
}
Я еще новичок и все еще учусь. Может ли кто-нибудь помочь вообще?
Спасибо Enissay, когда я работал, что ваш код делает, все это имело смысл. Отлично работает и является отличным способом решения проблемы. Большое спасибо. – trademark
Собственно, это отлично работает на странице листинга, которую я тестировал, однако на каждой странице листинга на веб-сайте есть текст, который я хочу выделить для другого «текстового номера». Он варьируется от страницы к странице. Есть ли способ обойти это? – trademark
@trademark проверить мой отредактированный ответ ... – Enissay