Я установил webscraper с beautifulsoup, selenium (chrome) и python.Selenium не полностью загружает файлы
Это довольно просто, beautifulsoup анализирует страницу, полную ссылок, и селен следует за этими ссылками 1 за раз. Selenium находит определенную ссылку для загрузки на каждой странице и нажимает ее, начиная загрузку. Я бы использовал beautifulsoup с этим, но если я не использую браузер, который нажимает на ссылку, он отправит меня на страницу с captcha.
В любом случае, когда селен начинает загрузку файлов, а прогессионные шоу отображаются в нижней части экрана с хромом. Но после кажущегося случайного количества времени, он говорит, что файл полностью загружается через несколько секунд, прежде чем он будет выполнен на полпути. Файл может быть размером 8 МБ, он загружает только 500 кб, а затем говорит, что он закончен. Я не знаю, почему он не будет полностью загружать файлы, не знает ли кто-нибудь способ дождаться его полной загрузки файла? Существует ли ограничение на количество загружаемых файлов одновременно? Потому что я загружаю довольно много файлов.
У меня нет понятия, что делать здесь, я надеюсь, что кто-то может пролить свет.
Это может быть, что вам не нужно селена здесь. Может быть, передача соответствующего заголовка (например, User-Agent, притворяясь браузером) поможет. Без кода трудно сказать. – alecxe