2009-06-10 4 views
2

Моя задача - сделать скриншоты из набора веб-страниц для юридических целей. В настоящее время я выполняю это, используя Webshot и выполняя его пакетную операцию, используя список URL-адресов, которые я скомпилировал сам. Я также должен сделать скриншоты вращающегося флеш-баннера, который выполняется с помощью функции IECapt и ее функции задержки.Как просканировать сайт и сделать скриншоты каждой страницы?

На каждой странице есть серия объявлений, для которых требуется скриншот страницы, к которой они ведут. Как я могу автоматизировать это, чтобы не тратить часы на каждую ссылку после ссылки?

В случае, если это неясно, на главной странице есть 4 вторичных объявления, ссылающихся на 4 страницы различных продуктов. Мне нужен скриншот домашней страницы (сделанный), а затем четыре разных скриншота страниц, на которые ссылаются объявления.

О, и сделать интересные вещи, как домашние страницы с помощью Javascript перенаправляет а-ля:

javascript:dcsOnsiteAdLink('url', '/whyjoin', 'ad', 'S1', 'popup', 'toolbar=yes,location=yes,directories=yes,status=yes,menubar=yes,scrollbars=yes,resizable=yes,width=780,height=500'); 

ответ

5

гнома веб-фото использует двигатель Geko, чтобы сделать и взять оснастку веб-страницы. Он довольно изящный и доступный для сценариев.

7

Оплатите кому-то 3 доллара США в час, чтобы сделать это за вас через Elance или Mechanical Turk. Даже если вы потратили всего 4 часа на взломать сценарий, это стоило бы дороже, чем заплатить за него несколько баксов.

+0

Это не идеальное решение, так как разработчик я мог бы управлять сайтом, который имеет много зависимостей, и я хочу, чтобы иметь возможность выпустить быстро. Я предлагаю попробовать один из многих сценариев Каспера, уже сделанных для этого или этого: https://www.npmjs.com/package/crawl – jasongonzales

3

Adobe Acrobat Pro довольно хорош в этом. Он может захватить весь сайт и превратить его в один проиндексированный документ. На снимках экрана вы получите только то, что находится на экране, Acrobat Pro может получить всю страницу.

Смежные вопросы