2013-11-16 4 views
2

Я пытаюсь извлечь html-документ с помощью JSoup, но он возвращает неполный HTML.JSoup возвращает неполный HTML-документ

Document doc = Jsoup.connect("http://stackoverflow.com/questions/79923"); 

что может быть неправильным?

+0

Что ваш результат? – MariuszS

+0

что вы ожидаете? что вы получаете вместо этого? – eis

+0

Я ожидаю, что стартовая страница html должна содержать , но в документе выбрана начальная позиция . Однако документ заканчивается правильно с, что является правильным. – user1493834

ответ

2

Максимальный размер документа необходимо продлить. По умолчанию он устанавливает максимальный предел в 1 МБ. Установив его в 0, он будет иметь неограниченный размер.

Connection connection = Jsoup.connect(String url); 
connection.maxBodySize(0); 
Document doc = connection.get(); 

Смотрите документацию Jsoup: http://jsoup.org/apidocs/org/jsoup/Connection.html#maxBodySize(int)

Смежные вопросы