- Скажем, блок 64 МБ находится на узле A и реплицируется среди 2 других узлов (B, C), а размер разделенного входа для программы уменьшения карты - 64 МБ, будет ли это разделение просто иметь место для узла A? Или у него будут места для всех трех узлов A, b, C?
- Поскольку данные являются локальными для всех трех узлов, как среда решает (выбирает) задачу карты для запуска на определенном узле?
- Как это обрабатывается, если размер Разделение ввода больше или меньше размера блока?
ответ
Hadoop знает, где находятся блоки. Если раскол точно равен одному блоку, то Hadoop попытается выполнить задачу карты на том же узле, чтобы применить принцип «локальности данных» и сохранить необходимые сетевые передачи.
Если доступны A, B, C, задача карты будет выполняться на узле, ближайшем к клиенту. Если узел A недоступен, он запускается на B или C, в зависимости от того, какой из них ближе всего к клиенту.
Если все A, B, C недоступны, Hadoop узнает, какой узел из A, B или C ближе всего к клиенту, а затем выберите свободный узел на той же стойке, что и A (поскольку внутри-стойка переводы быстрее). Если вся стойка занята, тогда у нее не будет выбора, кроме как выбрать другую стойку и узел для обработки раскола. Разделение будет временно скопировано на узел и после обработки оно будет удалено из временного местоположения.
Если, однако, разделение входа больше размера блока, то применяется тот же самый принцип. Единственное отличие состоит в том, что инфраструктура Hadoop даст «разделить + несколько строк из блока 2» на узел для обработки.
- 1. Входной бит и блок в hadoop
- 2. Hadoop меньше входной файл
- 3. Hadoop выбрать входной файл между входной папкой
- 4. Spark vs Hadoop
- 5. Javascript onclick функция. Входной блок. Ожидаемый блок
- 6. Hadoop контрольный блок
- 7. Hadoop API VS. Hadoop Streaming
- 8. Входной сигнал Hadoop для сжатого блока
- 9. hadoop Входной путь не существует
- 10. Hadoop - Входной путь не существует
- 11. Hadoop не распознает входной путь
- 12. раздельный селектор-событие- (ы) VS несколько if-statement
- 13. Hadoop vs Hazelcast
- 14. Hadoop Vs Data Lake
- 15. Блок отображения Vs. Непрозрачность
- 16. Блок проверки vs Nhibernate.Validator
- 17. VS shortcuts - создать блок
- 18. pthread_mutex_t VS @ синхронизированный блок?
- 19. Создайте блок и назовите его как входной блок?
- 20. Полу-раздельный союз
- 21. Rails двигатель раздельный маршрут
- 22. Входной разъем для функции карты в Hadoop
- 23. Nutch на Hadoop | Входной путь не существует:
- 24. Как разбить входной текст карты (Hadoop)?
- 25. Входной путь hadoop указать диапазон папок
- 26. Свиньи Входной путь к HDFS в Hadoop
- 27. Решение между mongoDb vs Mysql vs hadoop
- 28. excel входной блок vba функция отмены
- 29. блок инициализации vs constructor vs переменная инициализация
- 30. Как разбить входной набор для лучшего баланса Hadoop?
Возможный дубликат [Размер разделения входов Hadoop и размер блока] (http://stackoverflow.com/questions/17727468/hadoop-input-split-size-vs-block-size) –