Я пытаюсь разобрать и обработать HTML с помощью jsoup. Он работает отлично для большинства URL-адресов, но не работает. напримерОшибка Jsoup на некоторых сайтах
Это работает:
Document document = Jsoup.connect("https://www.yahoo.com/politics/time-to-take-sanders-seriously-1342599418519606.html")
.userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.95 Safari/537.11 Firefox/19.0")
.timeout(10*1000)
.get();
Это не удается:
Document document = Jsoup.connect("http://www.sciencedaily.com/releases/2016/02/160201215944.htm")
.userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.95 Safari/537.11 Firefox/19.0")
.timeout(10*1000)
.get();
Где я мог бы неправильно?
Спасибо.
Какова ошибка, которую вы получаете для второго примера? –
@sparky без ошибок. Ничего не возвращается. вещь объяснение по luksch имеет смысл –