Я пытался указать пользовательские опции в bin/crawl сценарий и столкнулся с проблемой. Я дал пользовательские конфигурации в Nutch игнорировать внешние в моей внешних ссылок команды ползать, как: -Пользовательские параметры в скрипте сканирования нутча не работают
бен/ползать -i -D elastic.index = тест -D db.ignore.external.links = истинные URLs/CrawlTest/3
Но это не работает. Затем я установил это свойство в nutch-site.xml, тогда он работает.
Затем я попытался настроить пользовательскую конфигурацию для индексирования данных на определенный индекс упругости, отличный от того, что указано в файле nutch-site.xml в качестве опции java в bin/crawl. К моему удивлению, он работает. Команда Я использовал: -
бен/ползать -i -D elastic.index = тест URLs/CrawlTest/3
Так что я хотел бы знать, почему моя первая команда Ждут» Я ничего не пропустил. Пожалуйста помоги.