Предположим, есть сайт abc.com, и мы сканируем abc.com на 100 страниц, как показано ниже.Является ли Heritrix Crawl детерминированным?
День 1: создайте задачу обхода в heritrix, указав maxDocumentsToDownload как 100 День 2: клонируйте вышеуказанное задание в heritrix и запустите.
Если веб-сайт не меняется в течение двух дней, я получаю одинаковые 100 страниц или разные 100 страниц?
В случае, если требуется больше информации, пожалуйста, дайте мне знать
Спасибо, Hareesh
Hi Girish, Спасибо, что ответили. Было ли это документировано где-то в документации Herittrix, что не будет никакой разницы в просмотре страниц, если веб-сайт не изменится? – TechyHarry
Нет, только что основанный на наблюдениях, я смог рассказать. –