Мой вопрос довольно прост: есть способ разобрать html в java на DOM-Document, если в htmlcontent есть теги, подобные этому img-тегу?Parsing html с «закрытыми тегами» в java
<p><img src="..."></p>
Это Codesnippet, что дает мне SAXException при анализе этих элементов:
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
InputStream is = new ByteArrayInputStream(htmlcontent.getBytes());
Document dom = db.parse(is);
is.close();
отлично работает для меня, спасибо! – billdoor
Не стесняйтесь утверждать ответ – Florent