Я использую BeautifulSoup (BS4) для создания инструмента скребка, который позволит мне вытащить имя продукта с любой страницы продукта TopShop.com, которая находится между тегами «h1». Не могу понять, почему код, который я написал, не работает!Скремблирование имен продуктов с помощью BeautifulSoup
from urllib2 import urlopen
from bs4 import BeautifulSoup
import re
TopShop_URL = raw_input("Enter a TopShop Product URL")
ProductPage = urlopen(TopShop_URL).read()
soup = BeautifulSoup(ProductPage)
ProductNames = soup.find_all('h1')
print ProductNames
Одна из проблем заключается в том, что ваш код генерирует SyntaxError на последней строке: http://ideone.com/ByfJ7K – bernie
Как «не работает»? Как результаты, которые вы видите, отличаются от ожидаемых? – bernie
@bernie не видит синтаксическую ошибку на моем конце. Ожидание очистки данных между тегами H1, но выше, похоже, ничего не возвращает. Я очень новичок в Python, нахожу свои ноги. –