Nutch crawling with seeds urls находятся в диапазоне

Некоторые сайты имеют URL-адрес, как www.___.com/id=1 до www.___.com/id=1000. Как я могу сканировать сайт с помощью nutch. Есть ли какие-либо возможности для получения семян для отбора в диапазоне?Nutch crawling with seeds urls находятся в диапазоне

источник

2010-06-12 user365345

Я думаю, что самый простой способ - создать скрипт для создания вашего первоначального списка URL-адресов.

источник

2010-06-14 13:39:37

no. вы вводите их вручную или используя сценарий

источник

2014-03-18 17:54:32 anu

Nutch crawling with seeds urls находятся в диапазоне

ответ

Смежные вопросы