У меня есть сценарий, который использует python и wget для загрузки веб-сайта, а затем выполняет некоторые задачи с файлами. Я использую строку os.system("wget -m -w 2 -P " directory)
для вызова wget, рекурсивную загрузку каждой страницы в домене. Это прекрасно работает, но теперь стало необходимо контролировать wget для ошибок при загрузке файла, когда он следует за ссылкой (ошибка Think 404, пытающаяся получить доступ к странице).Захват ошибок wget с python
Это не вопрос получения кода выхода, а просмотр каждого «блока» вывода, который снабжает wget.
Есть ли простой способ просмотреть вывод wget с помощью Python без необходимости перенаправлять его в файл, а затем искать файл для идентифицирующей строки текста?
Просто скачайте файлы непосредственно на Python, например, с помощью [запросов] (http://docs.python-requests.org/en/latest/) модуля. Тогда вы можете легко обрабатывать ошибки. – wenzul
Используйте модуль '' request' '(http://docs.python-requests.org/en/latest/) вместо 'wget'. Вы сбережете себе * тонну головных болей. –
@wenzul & Lukas Graf: внимательно прочитайте вопрос и в конце концов прочитайте страницу man для wget (в частности, что означает опция -m). –