2012-04-03 2 views

ответ

0

Я думаю, что это связано с тем, что ваш пример не является «действительным» html. Я считаю, что таблица не может существовать в теге p. Jsoup, вероятно, обеспечивает правильный HTML.

+0

если я заменить р тег по умолчанию тег, а затем разобрать код jsoup .... хорошо работает. – miaccio

0

jsoup очень умен. Он будет преобразовывать ваш текст ввода в действительный html-конус, если вы используете его метод разбора по умолчанию.

Document doc = Jsoup.parse(html);

На самом деле, jsoup может обрабатывать XML-подобный текст (конечно, в том числе HTML и XML). Вы можете попробовать метод follwing для анализа XML-текста. Он не будет реформировать ваш вход и проанализировать ввод как есть.

Document doc = Jsoup.parse(html, "", Parser.xmlParser());

+0

Это не отвечает на вопрос OP о том, является ли возвращение из Jsoup ошибкой или нет. – verdammelt

+0

@ verdammelt, да, он может вернуть недействительный код html из Jsoup. Но вопрошающий может захотеть найти способ избежать процесса проверки и реформирования интеллектуального jsoup. –

Смежные вопросы