2012-02-23 5 views
5

Как получить «этот текст» из следующего HTML-кода с помощью Jsoup?Как получить этот текст с помощью Jsoup?

<h2 class="link title"><a href="myhref.html">this text<img width=10 
     height=10 src="img.jpg" /><span class="blah"> 
     <span>Other texts</span><span class="sometime">00:00</span></span> 
     </a></h2> 

Когда я пытаюсь

String s = document.select("h2.title").select("a[href]").first().text(); 

возвращает

это textOther texts00: 00

Я пытался читать апи для Selector в Jsoup, но не мог понять много.

Также как получить элемент класса class="link title blah" (несколько классов?). Прости меня, я знаю только немного Jsoup и CSS.

ответ

9

Использовать Element#ownText() вместо Element#text().

String s = document.select("h2.link.title a[href]").first().ownText(); 

Обратите внимание, что вы можете выбрать элементы с несколькими классами, просто конкатенации Classname селекторы вместе, как в h2.link.title, которые будут выбирать <h2> элементы, которые имеют по крайней мере какlink и title класса.

+0

Спасибо, что сработали хорошо :) – wildnux

+0

Также как получить элемент класса class = class link blah "(несколько классов)? – wildnux

+0

Внимательно проверьте пример кода. После этого я добавил объяснение в ответ. – BalusC