Im используя beautifulsoup4 для анализа веб-страницы и собрать все HREF значения, используя этот кодКак решить, найти два каждого звена (BeautifulSoup, питона)
#Collect links from 'new' page
pageRequest = requests.get('http://www.supremenewyork.com/shop/all/shirts')
soup = BeautifulSoup(pageRequest.content, "html.parser")
links = soup.select("div.turbolink_scroller a")
allProductInfo = soup.find_all("a", class_="name-link")
print allProductInfo
linksList1 = []
for href in allProductInfo:
linksList1.append(href.get('href'))
print(linksList1)
linksList1 печатает два из каждой ссылки. Я считаю, что это происходит, поскольку он берет ссылку от названия, а также цвет элемента. Я пробовал несколько вещей, но не могу заставить BS разбирать только ссылку на титул и иметь список одной из ссылок вместо двух. Я представляю себе что-то очень простое, но им не хватает. Заранее спасибо
сделать ссылкиList1 набор() вместо списка() –
большое спасибо – Harvey