Я пытаюсь получить информацию о продукте с this. Для того, чтобы получить описание (присутствует в нижней части страницы), я использую XPathScrapy xpath удаление текста после <символ
response.xpath('//*[@itemprop="description"]/table//text()').extract()[3].strip()
Это дает мне описание:
u'Color: White, Size:Free Size, With the body: Braided, Buckle: Automatic Deduction, With the body width: section ('
в то время как один присутствующий на сайте является
Color: White, Size:Free Size, With the body: Braided, Buckle: Automatic Deduction, With the body width: section (<2cm), Belt Length: 93cm
Product Type: Belts, Accessories
Я проверил, что контент на сайте загружается даже после отключения javascript. Что мне здесь не хватает?
Похоже, что он отключен из-за знака '' ', даже BeautifulSoup вырезает текст после' <'... очень странного – heinst
, это ошибка' parsel', я проверю его в репозитории [здесь] (https://github.com/scrapy/parsel/issues/23) – eLRuLL
ответил ли ответ? – eLRuLL