2016-11-19 5 views
0

Я ищу способ кэшировать изображения, которые получают царапины.scrapy cache only images

У меня есть HTTPCACHE_ENABLED и я в настоящее время осуществляет Scrapy: FilesystemCacheStorage расширение,

Но теперь он кэширует все URL, которые получают Царапины, а только те, которые идут к трубопроводу изображения должны быть в кэше.

Другим решением будет метод кэширования страницы, но все же заготовьте чек, если скребковый валмент изменился с момента последнего скреста и проигнорировал изображения.

я пытался HTTPCACHE_IGNORE_SCHEMES, но я не знаю, как я направить свой url_list пункт в этом схемах

ответ

0

Таким образом, после некоторого копания в документации я обнаружил, что по умолчанию он использует DummyPolicy и изменения, которые в RFC2616 сделал именно то, что я искал.

Scrapy Documentation RFC2616