2010-10-23 7 views
7

Я пытаюсь искать в Google Cache, так что мне нужно стрелять этот запрос:Любой API для поиска Google Cache?

http://webcache.googleusercontent.com/search?q=cache:news.ycombinator.com/news+hacker+news 

И получить некоторое содержание, как метку времени со страницы. Но когда я делаю это с помощью curl (ruby), он дает отклоненную разрешенную ошибку, т. Е. Скребок блокируется и это ожидалось.

Итак, есть ли способ поиска кеша google (либо API, либо какого-либо обходного скопирования) и извлечь некоторую информацию, такую ​​как timestamp?

ответ

2

У меня не было API, но я могу его очистить, используя hpricot или nokogiri в рельсах (завиток в Rails разрешает отказ в разрешении). Я поставлю код, как только выясню, как извлечь отметку времени из вышеуказанного URL-адреса, используя эти драгоценные камни.

У любого есть лучшее решение?

Смежные вопросы