Я следую этому руководству http://doc.scrapy.org/en/0.16/topics/practices.html#run-scrapy-from-a-script, чтобы запустить scrapy из моего сценария. Вот часть моего сценария:Scrapy crawl from script всегда блокирует выполнение скрипта после скребка
crawler = Crawler(Settings(settings))
crawler.configure()
spider = crawler.spiders.create(spider_name)
crawler.crawl(spider)
crawler.start()
log.start()
reactor.run()
print "It can't be printed out!"
Он работает он должен: посещения страниц, скрести необходимую информацию и сохраняет выходной JSon где я сказал это (через FEED_URI). Но когда паук заканчивает свою работу (я вижу ее по номеру в выходном json), выполнение моего скрипта не возобновится. Возможно, это не проблема с scrapy. И ответ должен где-то в реакторе скручиваться. Как я могу освободить выполнение потока?
Wrap этот код в новый сценарий и называют это возможно? – Talvalin
Не уверен, что я получил ваш комментарий. Что значит «называть скрипт»? Он висит прямо в реакторе.run(), и журнал пишет мне: «INFO: Закрывающий паук (законченный)», поэтому паук, похоже, закончен. –