2015-02-08 3 views
1

Я пытаюсь очистить google для результатов reverse image search, используя Goutte (его в основном обертка вокруг парсера Guzzle + Symfony DOM).Не удалось очистить Google

Я делаю:

$googleURL = "https://www.google.com/searchbyimage?&image_url=".$imageURL; 

$crawler = $client->request('GET', $googleURL); 
$client->followRedirects(true); 
print_r($crawler,1); 

.. и выход (https://paste.ee/p/spfYA) содержит правильный URL, но и body (HTML) является страницы поиска по умолчанию, тот без результатов.

Что мне делать, чтобы получить результаты поиска в формате HTML.

+0

После нескольких запросов, Google получит ваш IP запрещен. Поэтому вам, возможно, придется использовать их API-интерфейсы вместо –

+0

. Хорошо, мне нужно получить всего несколько сотен за несколько дней. Кроме того, API для поиска обратного изображения отсутствует. – 3zzy

ответ

4

Все, что я должен был сделать был установлен агент пользователя:

$client->setHeader('User-Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/40.0.2214.111 Safari/537.36'); 
Смежные вопросы