Я использую этот запрос:XPath - все элементы внутри тела
//*[self::div or self::p or self::span]/text()[normalize-space()][string-length() > 140]
.. но он также извлекает содержимое из необязательных элементов (<head>
и т.д ..), поэтому я хочу, чтобы ограничить поиск в <body>
, но это не работает по какой-то причине:
//body/*[self::div or self::p or self::span]/text()[normalize-space()][string-length() > 140]
... для этого HTML: http://pastebin.com/F4xVDL8Q