Я пытаюсь скачать кучу PDF-файлов из here с помощью запросов и beautifulsoup4. Это мой код:Загрузка файлов с помощью запросов и BeautifulSoup
import requests
from bs4 import BeautifulSoup as bs
_ANO = '2013/'
_MES = '01/'
_MATERIAS = 'matematica/'
_CONTEXT = 'wp-content/uploads/' + _ANO + _MES
_URL = 'http://www.desconversa.com.br/' + _MATERIAS + _CONTEXT
r = requests.get(_URL)
soup = bs(r.text)
for i, link in enumerate(soup.findAll('a')):
_FULLURL = _URL + link.get('href')
for x in range(i):
output = open('file[%d].pdf' % x, 'wb')
output.write(_FULLURL.read())
output.close()
Я получаю AttributeError: 'str' object has no attribute 'read'
.
Хорошо, я знаю это, но ... как можно загрузить с этого URL-адреса?
почему строка прочитал()? –
FULLURL - это, очевидно, строка. И вы, вероятно, захотите получить содержимое этого URL-адреса и сохранить контент вместо сохранения URL-адреса. Поэтому, пожалуйста, исправьте свой код. –
открыть URL с 'request.get (_FULLURL)', и вы сможете сохранить содержимое содержимого ответа в файл. – TankorSmash