Когда я анализирую этот код с Jsoup:Jsoup Ошибка синтаксического анализа (тег таблицы в тег р)
<p>
<table>[...]</table>
</p>
Jsoup возвращает:
<p></p>
<table>[...]</table>
Является ли это ошибкой? Как я могу это исправить?
Когда я анализирую этот код с Jsoup:Jsoup Ошибка синтаксического анализа (тег таблицы в тег р)
<p>
<table>[...]</table>
</p>
Jsoup возвращает:
<p></p>
<table>[...]</table>
Является ли это ошибкой? Как я могу это исправить?
Я думаю, что это связано с тем, что ваш пример не является «действительным» html. Я считаю, что таблица не может существовать в теге p. Jsoup, вероятно, обеспечивает правильный HTML.
jsoup очень умен. Он будет преобразовывать ваш текст ввода в действительный html-конус, если вы используете его метод разбора по умолчанию.
Document doc = Jsoup.parse(html);
На самом деле, jsoup может обрабатывать XML-подобный текст (конечно, в том числе HTML и XML). Вы можете попробовать метод follwing для анализа XML-текста. Он не будет реформировать ваш вход и проанализировать ввод как есть.
Document doc = Jsoup.parse(html, "", Parser.xmlParser());
Это не отвечает на вопрос OP о том, является ли возвращение из Jsoup ошибкой или нет. – verdammelt
@ verdammelt, да, он может вернуть недействительный код html из Jsoup. Но вопрошающий может захотеть найти способ избежать процесса проверки и реформирования интеллектуального jsoup. –
если я заменить р тег по умолчанию тег, а затем разобрать код jsoup .... хорошо работает. – miaccio