Извлечение элементов в Scrapy в разные области

Я новичок в scrapy и пытался очистить некоторые изображения с одного из сайтов моих поставщиков.Извлечение элементов в Scrapy в разные области

Это HTML-код:

<div class="image-additional caruofredsel-additional"> 
    <a href="http://scssports.in/image/cache/data/adidas-t-t-husgado-white-unisex-sports-shoes-g40422-500x500.jpg" title="Adidas T T Husgado Badminton and Squash Shoes" class="colorbox" rel="colorbox"><img class="fade-image" 
src="http://scssports.in/image/cache/data/adidas-t-t-husgado-white-unisex-sports-shoes-g40422-80x80.jpg" title="Adidas T T Husgado Badminton and Squash Shoes" alt="Adidas T T Husgado Badminton and Squash Shoes" /> 
</a>

Как вы можете видеть, что есть два изображения URLs там. Я создал два поля differents в файле items.py, а именно imgurl1 и imgurl2, поскольку я хочу, чтобы эти два разных изображения сохранялись под разными столбцами, когда я экспортирую их в csv.

Есть ли способ, которым я могу это сделать?

Мой код:

titles = hxs.select("//div[@class='image-additional caruofredsel-additional']") 
     items = [] 
     for titles in titles: 
      item = SampleItem() 
      item ["imgurl2"] = titles.select("a/@href").extract() 
      items.append(item)

Спасибо!

источник

2014-02-07 quasarseeker

Как <img> тег внутри тега <a>, это должно работать

item ["imgurl1"] = titles.select("a/img/@src").extract()

источник

2014-02-07 12:49:23 warvariuc

Извлечение элементов в Scrapy в разные области

ответ

Смежные вопросы