Я использую nutch 2.3. Все задания запускаются один за другим, т. Е. Первый генератор, выборка, анализ, индекс и т. Д. Я хочу запускать несколько заданий одновременно. Я знаю, что некоторые задания не могут выполняться параллельно, но другие могут, например, выполнять синтаксический анализ, dbupdate, indexjob следует запускать с извлечением.Как запустить apache nutch различные задания параллельно.
Возможно ли это? Моя основная цель - постоянно запускать работу по набору. Я полагаю, что мы можем сделать это с другой меткой времени. Может ли кто-нибудь вести меня надлежащим образом?
Может быть, вы можете использовать hadoop с nutch. –