Я пытаюсь получить изображения из поиска изображений Google по конкретному запросу. Но страница, которую я загружаю без фотографий, перенаправляет меня на оригинальную версию Google. Вот мой код:Python: правильный URL-адрес для загрузки изображений из Google Image Search
AGENT_ID = "Mozilla/5.0 (X11; Linux x86_64; rv:7.0.1) Gecko/20100101 Firefox/7.0.1"
GOOGLE_URL = "https://www.google.com/images?source=hp&q={0}"
_myGooglePage = ""
def scrape(self, theQuery) :
self._myGooglePage = subprocess.check_output(["curl", "-L", "-A", self.AGENT_ID, self.GOOGLE_URL.format(urllib.quote(theQuery))], stderr=subprocess.STDOUT)
print self.GOOGLE_URL.format(urllib.quote(theQuery))
print self._myGooglePage
f = open('./../../googleimages.html', 'w')
f.write(self._myGooglePage)
Что я делаю неправильно?
Благодаря
по крайней мере, вам нужно закрыть дескриптор файла –
он сработал! спасибо – lorussian
@silviolor: Я знаю, что это не поможет вашей проблеме, но почему бы не использовать встроенный модуль 'urllib2' python вместо' curl'. – RanRag