1
Я использую scrapy 1.0.3. Вот мой код файла-паука,Я получаю все якорные ссылки вместо конкретной ссылки в scrapy
from scrapy import Spider
from scrapy.selector import Selector
from parser_xxx.items import XxxItem
class XxxSpider(Spider):
name = "xxx"
allowed_domains = ["xxx.xxx.com"]
start_urls = ["http://xxx.xxx.com/jobs/"]
def parse(self, response):
quelist = Selector(response).xpath('//div[@id="job_listings"]')
for que in quelist:
item = XxxItem()
item['title'] = que.xpath('//a//h4/text()').extract()
item['link'] = que.xpath('//a/@href').extract()
yield item
Но, я получаю все якорные ссылки и все заголовки. Где я ошибаюсь?
Заранее благодарен!
Спасибо! Я помню. –
Теперь он работает правильно. –
@MayurKoshti рада помочь. Также обратите внимание, что здесь вы можете использовать ярлык 'response.xpath()'. – alecxe