2011-12-27 3 views

ответ

0

Спасибо за ответы, я был неправ. Проблема не в этих тегах html. Поскольку htmlpage, которую я хотел преобразовать, содержал недопустимые символы xml, поэтому я не смог ее преобразовать.

Я нашел решение, используя XMLChar.isValid метод библиотеки Xerces. Кроме того, я должен был удалить все сценарий и стиль теги HTMLPage с этим кодом:

final DomNodeList<HtmlElement> scriptElements = html.getElementsByTagName("script"); 
if (!scriptElements.isEmpty()){ 
    for (HtmlElement scriptElement : scriptElements){ 
     scriptElement.removeAllChildren(); 
    } 
} 
0

Вы можете использовать HTML Tidy исправить HTML. Библиотека Java - JTidy. JTidy можно настроить для создания XHTML.

Смежные вопросы