Я использую JSoup для обхода сайта, но он перенаправляется на новую страницу с помощью javascript. Я уверен, что он не использует перенаправление 302, потому что он прекратит перенаправление, когда я отключу javascript моего браузера. Есть ли способ разрешить JSoup автоматически следовать переадресации javascript? Если нет, какие другие альтернативы разрешают переадресацию javascript?JSoup autofollow javascript redirect
0
A
ответ
2
Jsoup - это синтаксический анализатор. Он не включает механизм выполнения javascript, поэтому он не может выполнить javascript. Для выполнения javascript вам нужно будет использовать headless browser, например selenium webdriver.
Другой альтернативный вариант - проанализировать javascript (как текст), который отвечает за перенаправление и извлекает URL. После этого вы просто делаете то, что обычно делаете, чтобы очистить сайт. Но это «взломать», это не автоматическое, и я не знаю, достаточно ли это для ваших нужд.
Смежные вопросы
- 1. Jsoup meta refresh redirect
- 2. jsoup parse с сайта redirect
- 3. JSoup и код Javascript
- 4. Jsoup javascript button click
- 5. JSoup и JavaScript
- 6. Javascript redirect - новое окно
- 7. Javascript URL redirect
- 8. javascript url undefined redirect
- 9. HTML Javascript Mobile Redirect
- 10. Javascript not redirect
- 11. javascript redirect не работает
- 12. php и javascript redirect
- 13. Javascript redirect бесконечный цикл
- 14. Javascript mobile redirect script
- 15. PHP JavaScript redirect issue
- 16. JavaScript Redirect Issue
- 17. JavaScript Redirect Concatenating
- 18. Условие PHP - Javascript redirect
- 19. Javascript redirect как Forbes
- 20. javascript redirect chrome issue
- 21. Javascript/PHP redirect
- 22. Javascript timed redirect
- 23. javascript redirect действительно работает
- 24. Javascript redirect loop
- 25. JavaScript auto redirect
- 26. Javascript mobile redirect issue
- 27. Kerberos redirect
- 28. Android: Выполнить javascript для Jsoup
- 29. JSOUP Скребок JavaScript часть Java
- 30. Javascript Redirect Out Of Iframe Javascript/PHP
Сайт защищен сервисом scrapping, таким как ShieldSquare и DistillNetwork. Будет ли работать webdriver? Javascript на странице был углублен, поэтому получить URL-адрес невозможно. Но я думаю, что эти службы защиты также создают отпечаток пальца. У вас есть опыт в этом? – angelokh
К сожалению нет. Но, я полагаю, даже эти службы зависят от заголовков, отправленных клиентом. Selenium имитирует обычный браузер, поэтому, если вы правильно настроили заголовки (userAgent и т. Д.), Я не верю, что проблема будет. Сервер не сможет определить разницу между браузером без браузера и обычным браузером. Но, как я уже сказал, у меня нет опыта работы с этими службами, так что принимайте то, что я говорю, с солью. Чтобы проверить заголовки, отправленные вашим браузером, проверьте это http://stackoverflow.com/questions/31549799/using-jsoup-to-login-to-coned-website/31570494#31570494 – alkis