2015-06-10 7 views
0

Я пытаюсь найти все элементы внутри этого вида HTML:Получить все элементы с Jsoup

<body> 
My text without tag 
<br>Some title</br> 
<img class="image" src="url"> 
My second text without tag 
<p>Some Text</p> 
<p class="MsoNormal">Some text</p> 
<ul> 
<li>1</li> 
<li>2</li> 
</ul> 
</body> 

мне нужно получить все элементы включают в себя части без тега. Как он может это получить?

P.S.: Мне нужно получить массив «Элемента» для каждого элемента.

+0

* Детали без метки * все еще находятся в некотором теге, не так ли? –

+0

Как вы представляете, что этот «массив» элемента «*» должен выглядеть? Каким должен быть его контент? – Pshemo

+0

@Pshemo Я думаю, что это может быть класс «Элементы» со всеми этими элементами – aef67

ответ

0

Не совсем уверен, если вы запрашиваете весь текст в html. чтобы сделать это, вы можете просто сделать следующее:

String html; // your html code 
Document doc = Jsoup.parse(html); //parse the string 
System.out.println(doc.text()); // get all the text from tags. 

ВЫВОД:

Мой текст без тега Некоторые название Мой второй текст без тега Some Text Некоторый текст 1 2

0

На всякий случай, если вы используете html-файл, вы можете использовать приведенный ниже код и получить каждый тег, который вам нужен. API - Jsoup. Вы можете найти больше примеров в приведенной ниже ссылке http://jsoup.org/

File input = new File(htmlFilePath); 

InputStream is = new FileInputStream(input); 

String html = IOUtils.toString(is); 

Document htmlDoc = Jsoup.parse(html); 

Elements pElements = htmlDoc.select("P"); 

Element pElement1 = pElements.get(0); 
Смежные вопросы