Я пытаюсь запустить Scrapy с Python. Я смотрю на этот код, который (source):Scrapy run from Python
from twisted.internet import reactor
from scrapy.crawler import Crawler
from scrapy.settings import Settings
from scrapy import log
from testspiders.spiders.followall import FollowAllSpider
spider = FollowAllSpider(domain='scrapinghub.com')
crawler = Crawler(Settings())
crawler.configure()
crawler.crawl(spider)
crawler.start()
log.start()
reactor.run() # the script will block here
Моя проблема заключается в том, что я запутался о том, как настроить этот код для запуска свой собственный паук. Я назвал мой spider-проект «spider_a», который указывает домен на обход внутри самого паука.
То, что я спрашиваю, если я запускаю мой паук со следующим кодом:
scrapy crawl spider_a
Как настроить пример кода питона выше, чтобы сделать то же самое?
Выполнение этого способа игнорирует настройки пользователя. – Medeiros