Предположим, у меня есть весь HTML-адрес страницы результатов поиска Google. Кто-нибудь знает какой-либо существующий код (Ruby?), Чтобы очистить/проанализировать первую страницу результатов поиска Google? В идеале он будет обрабатывать разделы «Результаты покупок и видео», которые могут появиться где угодно.Скремблирование/анализ результатов поиска Google в Ruby
Если нет, то какой лучший инструмент на основе Ruby для скриншотов в целом?
Чтобы уточнить: я знаю, что трудно или невозможно получить результаты поиска Google программно/API-интерфейсом, а просто страницы результатов CURLing имеют много проблем. На обоих этих пунктах есть консенсус в stackoverflow. Мой вопрос другой.
Предлагаю взглянуть на проверку ранга Google (http://google-rank-checker.squabbel.com). Это не рубин, это написано на PHP. Но это открытый исходный код и решает все задачи, которые вам нужны. Вы, похоже, не были исправлены в рубине, я лично использовал PHP (консольные скрипты) для многих таких проектов (также в производственных средах). Во всяком случае, даже когда вы пишете в рубине, вы найдете код PHP полезным, поскольку некоторые задачи при очистке Google могут быть довольно сложными (задержки, IP-адреса, разбор DOM, отправка правильных параметров GET и т. Д.). – John