Когда я пытаюсь сканировать Google для результатов поиска, Scrapy только дает домашнюю страницу Google: http://pastebin.com/FUbvbhN4Scrapy: Google Crawl не работает
Вот мой паук:
import scrapy
class GoogleFinanceSpider(scrapy.Spider):
name = "google"
start_urls = ['http://www.google.com/#q=finance.google.com:+3m+co']
allowed_domains = ['www.google.com']
def parse(self, response):
filename = response.url.split("/")[-2] + '.html'
with open(filename, 'wb') as f:
f.write(response.body)
Есть ли что-то неправильно с этим URL-адресом в качестве исходного URL-адреса? Когда я открываю его в своем браузере - помещая его в адресную строку (не заполняя форму поиска) - я получаю действительные результаты поиска.
Ах, да. Это связано с тем, что Chrome поддерживает Google. Когда я пытаюсь это сделать в Safari, он делает то же самое (перенаправляет на главную страницу Google). –
отлично, так это работало сейчас? – eLRuLL
Да, спасибо! –