Я пытаюсь захватить HTML-источник веб-сайта с помощью Python. Однако, когда вы посещаете какую-либо страницу на сайте, есть отложенная переадресация, почти как экран загрузки. Всякий раз, когда я делаю requests.get(url)
, я в конечном итоге хватаю этот экран загрузки, а не то, что приходит после него. Я использую библиотеку запросов. Есть ли способ заставить запрос ждать до перенаправления? Переадресация - около 3 секунд.Захват HTML-источника после отложенного перенаправления
Вот код, я использую:
import Requests
page = requests.get(url)
print(page.text)
Запросы не могут быть лучшим инструментом для этого, если сайт использует javascript для рендеринга содержимого после экрана загрузки. У вас есть URL-адрес веб-сайта, который вы хотите захватить источником? – kanghj91
Перенаправление, скорее всего, выполняется * в браузере *, потому что браузер выполняет Javascript-код. Либо используйте браузер без браузера, чтобы сделать то же самое, либо перепроектировать javascript для загрузки адресата напрямую. –
Что такое URL? –