Каково максимальное количество экземпляров обходчика Apache Nutch, которые могут работать одновременно с одним ведущим узлом?Максимальное количество экземпляров сотрудников Apache Nutch
7
A
ответ
1
Непонятно, что вы подразумеваете под экземплярами гусениц. Если вы хотите запустить скрипт обхода несколько раз параллельно, например. у вас есть отличные обходы с отдельными конфигурациями, семенами и т. д. ... тогда они будут соревноваться за слоты в кластере Hadoop. Затем он будет сводиться к тому, сколько слотов карты/редуктора доступно на вашем кластере, что само по себе зависит от количества рабов.
Обработка нескольких сборок Nutch параллельно может стать очень сложной и ресурсной неэффективной. Вместо этого подумайте о своей архитектуре, чтобы все логические сканеры могли работать как один физический или посмотреть на StormCrawler, что должно быть лучше подходит для этого.
Смежные вопросы
- 1. Apache Nutch: количество семян изменяет поведение сканирования.
- 2. Как запустить несколько экземпляров nutch?
- 3. Максимальное количество одновременных экземпляров MediaRecorder на Android?
- 4. Превышает максимальное количество экземпляров OpenCore в android
- 5. Найти месяц, в котором максимальное количество нанятых сотрудников
- 6. nutch crawler - как установить максимальное количество входящих ссылок на хост
- 7. Максимальное количество подключений (Debian, phpmyadmin, apache)
- 8. Подсчитайте максимальное количество значений
- 9. Apache Nutch с Lucene
- 10. Apache NUTCH, соответствующее обход
- 11. Apache Nutch-2.2.1 установка
- 12. Apache Nutch шаги объяснения
- 13. Apache Nutch on Windows
- 14. Запуск apache Nutch 2.2.1
- 15. Apache Nutch - NoSuchMethodError
- 16. Apache Nutch не найдено
- 17. Apache nutch 1.9 database
- 18. Как увеличить количество документов, полученных с помощью Apache Nutch crawler
- 19. Apache Nutch NoSuchElementException с bin/nutch inject, readdb, сгенерировать параметры
- 20. Принудительное количество экземпляров
- 21. Как использовать Apache Spark с Apache Nutch
- 22. Количество экземпляров строки и количество этих экземпляров
- 23. питон apscheduler - пропущено: максимальное количество запущенных экземпляров достигло
- 24. Appengine - Ограничить количество экземпляров
- 25. Apache nutch больше не ползает
- 26. Подключение MySQL к Apache nutch
- 27. Запуск Apache Nutch на окнах
- 28. apache nutch generate only fetchlist
- 29. Любая альтернатива для Apache Nutch?
- 30. Интеграция Apache Nutch и Solr