Что я пытаюсь сделать, так это использовать Beautifulsoup для загрузки каждого zip-файла из архива Google Patent. Ниже приведен код, который я написал до сих пор. Но кажется, что у меня возникают проблемы с загрузкой файлов в каталог на моем рабочем столе. Любая помощь будет принята с благодарностьюBeautifulsoup скачать все .zip-файлы из Google Patent Search
from bs4 import BeautifulSoup
import urllib2
import re
import pandas as pd
url = 'http://www.google.com/googlebooks/uspto-patents-grants.html'
site = urllib2.urlopen(url)
html = site.read()
soup = BeautifulSoup(html)
soup.prettify()
path = open('/Users/username/Desktop/', "wb")
for name in soup.findAll('a', href=True):
print name['href']
linkpath = name['href']
rq = urllib2.request(linkpath)
res = urllib2.urlope
результат, который я должен получить, что все почтовые файлы должны загрузить в определенную директорию. Вместо этого, я получаю следующее сообщение об ошибке:
> #2015 --------------------------------------------------------------------------- AttributeError Traceback (most recent call last)
> <ipython-input-13-874f34e07473> in <module>() 17 print name['href'] 18
> linkpath = name['href'] ---> 19 rq = urllib2.request(namep) 20 res =
> urllib2.urlopen(rq) 21 path.write(res.read()) AttributeError: 'module'
> object has no attribute 'request' –
Что вы возникли проблемы с? Каковы ожидаемые результаты? Что происходит вместо этого? –
Предполагается загрузить все zip-файлы, но вместо этого я получаю эту ошибку. # 2015 ----------------------------- ---------------------------------------------- Traтрибут атрибутаError (самый последний вызов последнего) в () 17 имени печати [ 'HREF'] 18 linkpath = имя [ 'HREF'] ---> 19 Rq = urllib2.request (namep) 20 res = urllib2.urlopen (rq) 21 path.write (res.read()) AttributeError: объект 'module' не имеет атрибута 'request' –
icomefromchaos