Как отслеживать состояние scrapy во время работы

Я хочу знать, что происходит во время работы scrapy, как я могу контролировать статус?Как отслеживать состояние scrapy во время работы

источник

2014-10-13 Spy

Существует два метода. Первый метод - вот пример из официального документа.

telnet localhost 6023 
>>> est() 
Execution engine status 
time()-engine.start_time : 8.62972998619 
engine.has_capacity() :   False 
len(engine.downloader.active) :   16 
engine.scraper.is_idle() :  False 
engine.spider.name :  followall 
engine.spider_is_idle(engine.spider) :  False 
engine.slot.closing :  False 
len(engine.slot.inprogress) :  16 
len(engine.slot.scheduler.dqs or []) :  0 
len(engine.slot.scheduler.mqs) :  92 
len(engine.scraper.slot.queue) :  0 
len(engine.scraper.slot.active) :  0 
engine.scraper.slot.active_size :  0 
engine.scraper.slot.itemproc_size :   0 
engine.scraper.slot.needs_backout() : False

Дополнительную информацию см. В официальном документе.

Второй способ кажется немного проще. Вы можете получить получить статус гусеничных по следующему методу:

self.crawler.stats.get_stats() 
or 
    spider.crawler.stats.get_stats()

Так, просто распечатать статус, как вам нравится.

источник

2014-10-13 12:22:38 zczhuohuo

спасибо. В официальном документе есть «веб-сервис», знаете ли вы, как его включить? – Spy

Включено по умолчанию. Но если вы не уверены, вы можете явно включить, установив WEBSERVICE_ENABLED = True – zczhuohuo

вы правы, отлично thx – Spy

Как отслеживать состояние scrapy во время работы

ответ

Смежные вопросы