В настоящее время я использую CyberNeko в попытке захватить информацию, которую я хочу с веб-сайта. Тем не менее, я считаю, что веб-сайт проверяет версию агента пользователя/браузера, чтобы просто не хватать содержимое URL-адреса.Groovy: CyberNeko | Пользовательские агенты | Версия браузера
Мне известно об использовании htmlunit для изменения версии браузера, но не уверен, могу ли я это сделать с помощью CyberNeko.
Кто-нибудь знает, возможно ли это сделать?
Подумайте об этом на мгновение:. Если владелец сайта не хочет, чтобы люди скрести странице, может быть, вы не должны пытаться быть аморальными и обходить это? Я уверен, что если вы обратитесь к владельцу сайта, он может быть более чем готов предоставить вам данные в каком-то другом формате, который не накладывает такую большую нагрузку на сайт, как обычно это делают скребки, или, может быть, есть даже доступный API для третьих сторон. – Esko 2010-11-24 09:05:53
Объем контента, который я ищу, является крошечным. Я просто предпочитаю не тратить час на выполнение задачи, которая может быть автоматизирована до гораздо более короткой. – StartingGroovy 2010-11-30 23:22:33