У меня есть HTML-строку, которая может выглядеть примерно так:PHP DOM: Получить все текстовые значения
<body>
<div>
<span class="blah">Monkey </span>
<p>breath really <b>stinks</b></p>
And I don't like it!
</div>
</body>
Как вы можете видеть, что есть какой-то текст, содержащийся правильно как значение внутри элемента, есть элементы, содержащие текстовые узлы и другие элементы. Я хотел бы получить все текстовые значения под телом (предположим, что тело - это элемент DOMElement, который я сохранил в переменной).
Таким образом, вывод будет выглядеть примерно так:
обезьяны Breat действительно воняет И мне не нравится это!
Как бы это сделать? XPath? Regexps? Магия?
Попробуйте волшебство, когда он чувствует, вы используете javascript. – Chibuzo
@jwegner - зачем вам это делать? в чем дело? – Flukey
@Flukey Подобно «плотности ссылок», как обсуждалось [здесь] (http://stackoverflow.com/questions/3652657/what-algorithm-does-readability-use-for-extracting-text-from-urls), я бы как рассчитать плотность для HTML-формы – jwegner