1
У меня есть этот код:Как получить ссылку insdie тег li?
import urllib
from bs4 import BeautifulSoup
url = "http://download.cnet.com/windows/"
pageHtml = urllib.urlopen(url)
soup = BeautifulSoup(pageHtml)
for a in soup.select("div.catFlyout a[href]"):
print "http://download.cnet.com"+a["href"]
Но этот код не дал правильный вывод. правильный вывод должен быть таким:
http://download.cnet.com/windows/security-software/
http://download.cnet.com/windows/browsers/
http://download.cnet.com/windows/business-software/
..
..
http://download.cnet.com/windows/video-software/
Как если хотите принять только ссылку категории, а не все суб внутри категория? @alexce –
@wanmohdpayed, что вы подразумеваете под категориями ссылок? Ссылки, которые не заканчиваются на 'html'? – alecxe
Я имею в виду, что хочу только ссылку под категорию. Я не хочу, чтобы суб-ссылка внутри ссылки под категорией. @alexce –