2010-06-01 4 views
0

Есть ли библиотека или метод для ввода строки с html-кодом, и у которой есть возвращаемое значение другой String без этого HTML-кода, просто информация ???
Я смотрю библиотеки таких JTidy или HtmlParser, но я не знаю, как их использовать! Что-то проще ???Html code clearner

+0

На каком языке? –

+1

Пожалуйста, исправьте все опечатки. Трудно читать –

+0

В java, извините. – Blanca

ответ

0

Это позволит удалить все HTML-теги из данной строки.

String html = //... 
html = html.replaceAll("</?.*?>", ""); 

Но если вы хотите, чтобы экран-переделку, вы можете использовать XPath вытащить конкретные части HTML:

StreamSource source = new StreamSource(new StringReader(html)); 
DOMResult result = new DOMResult(); 
Transformer transformer = TransformerFactory.newInstance().newTransformer(); 
transformer.transform(source, result); 
Node root = result.getNode(); 

XPath xpath = XPathFactory.newInstance().newXPath(); 

String value = xpath.evaluate("/the/xpath/expression", root);