У меня есть эта ссылка:Как получить следующую ссылку на страницу в python beautifulsoup?
http://www.brothersoft.com/windows/categories.html
Я пытаюсь получить ссылку на элемент внутри DIV. Пример:
http://www.brothersoft.com/windows/mp3_audio/midi_tools/
Я попробовал этот код:
import urllib
from bs4 import BeautifulSoup
url = 'http://www.brothersoft.com/windows/categories.html'
pageHtml = urllib.urlopen(url).read()
soup = BeautifulSoup(pageHtml)
sAll = [div.find('a') for div in soup.findAll('div', attrs={'class':'brLeft'})]
for i in sAll:
print "http://www.brothersoft.com"+i['href']
Но я только получаю выход:
http://www.brothersoft.com/windows/mp3_audio/
Как я могу получить выход, что мне нужно?
Прекрасно работает, в чем проблема? – dorvak
вывод должен быть http://www.brothersoft.com/windows/mp3_audio/midi_tools/ –