import requests
from bs4 import BeautifulSoup
r = requests.get("http://www.forever21.com/IN/Product/Category.aspx? br=f21&category=top&pagesize=100&page=1")
soup = BeautifulSoup(r.content, "html.parser")
links = soup.find_all('a', href=True)
for link in links:
if "BR=LOVE" in str(link):
link = str(link)
result = link[9:124]
#if "VariantID=" in result:
print((result))
Приведенный выше код возвращает список ссылок с сайта forever21.com. Но проблема в том, вместо:Скребковые ссылки в Python3
http://www.forever21.com/IN/Product/Product.aspx?BR=LOVE21&Category=top&ProductID=2000183855&VariantID=
возвращает
http://www.forever21.com/IN/Product/Product.aspx?BR=LOVE21&:Category=top&:ProductID=2000183855&:VariantID=
Обратите внимание, он автоматически заменяет &
с &:
в каждом звене. Не знаю, почему.
Просьба сообщить мне, почему это происходит?
Вы уверены, что это '& amp:', а не '&' (с точкой с запятой)? –