2016-10-14 2 views
0

Я использую scrapy для того, чтобы принести некоторые веб-контента, таким образом:скребковые кэшированные страницы

class PitchforkTracks(scrapy.Spider): 
    name = "pitchfork_tracks" 
    allowed_domains = ["pitchfork.com"] 
    start_urls = [ 
        "http://pitchfork.com/reviews/best/tracks/?page=1", 
        "http://pitchfork.com/reviews/best/tracks/?page=2", 
        "http://pitchfork.com/reviews/best/tracks/?page=3", 
    ] 

все работает нормально.

сейчас, вместо того, чтобы ударять по страницам напрямую, я хотел бы очистить googlecaches из этих же страниц.

Что такое надлежащее syntax для достижения этого?

PS: Я пробовал "cache:http://pitchfork.com/reviews/best/tracks/?page=1",, безрезультатно.

ответ

Смежные вопросы