2016-09-29 2 views
2

Я пытался указать пользовательские опции в bin/crawl сценарий и столкнулся с проблемой. Я дал пользовательские конфигурации в Nutch игнорировать внешние в моей внешних ссылок команды ползать, как: -Пользовательские параметры в скрипте сканирования нутча не работают

бен/ползать -i -D elastic.index = тест -D db.ignore.external.links = истинные URLs/CrawlTest/3

Но это не работает. Затем я установил это свойство в nutch-site.xml, тогда он работает.

Затем я попытался настроить пользовательскую конфигурацию для индексирования данных на определенный индекс упругости, отличный от того, что указано в файле nutch-site.xml в качестве опции java в bin/crawl. К моему удивлению, он работает. Команда Я использовал: -

бен/ползать -i -D elastic.index = тест URLs/CrawlTest/3

Так что я хотел бы знать, почему моя первая команда Ждут» Я ничего не пропустил. Пожалуйста помоги.

ответ

2

Из дальнейшего изучения я получил ответ myselves. Первая команда не работала, потому что hasoop не обнаруживает ее как аргумент. Его следует читать из конфигурации nutch.

Смежные вопросы