Я хочу загрузить, чтобы загрузить первый файл pdb из результата поиска (ссылка для скачивания, приведенная ниже). Я использую python, selenium и beautifulsoup. Я разработал код до этого момента.скачать файл с помощью python beautifulsoup и selenium
import urllib2
from BeautifulSoup import BeautifulSoup
from selenium import webdriver
uni_id = "P22216"
# set parameters
download_dir = "/home/home/Desktop/"
url = "http://www.rcsb.org/pdb/search/smart.do?smartComparator=and&smartSearchSubtype_0=UpAccessionIdQuery&target=Current&accessionIdList_0=%s" % uni_id
print "url - ", url
# opening the url
text = urllib2.urlopen(url).read();
#print "text : ", text
soup = BeautifulSoup(text);
#print soup
print
table = soup.find("table", {"class":"queryBlue"})
#print "table : ", table
status = 0
rows = table.findAll('tr')
for tr in rows:
try:
cols = tr.findAll('td')
if cols:
link = cols[1].find('a').get('href')
print "link : ", link
if link:
if status==1:
main_url = "http://www.rcsb.org" + link
print "main_url-----", main_url
status = False
browser.click(main_url)
status+=1
except:
pass
Я получаю форму как никто.
Как загрузить первый файл в списке поиска? (Т.е. 2YGV в данном случае)
Download link is : /pdb/protein/P32447
Работы для меня. Получение '/pdb/explore/explore.do? StructureId = 2YGV'. В чем проблема? Вы не можете скачать его? – ton1c
Я также получил это, но как скачать этот файл. dats моя проблема – sam