Я изучаю Hadoop.
Я запускаю Hadoop на одном узле.
По моим сведениям, редуктор работает после завершения Mapper (и это имеет смысл также).
Но когда я запустил задание MapReduce в файле размером 200 МБ, Reducer начал работу до завершения Mapper. Я не использовал комбайнер.
Может ли кто-нибудь объяснить, почему?MapReduce последовательность выполнения на одном узле
0
A
ответ
1
Уменьшить фазы включает в себя копирование и слияние вывод данных из мапперов к редуктору.
Поскольку копирование и слияние промежуточных выходов не требует барьера (вам не нужно ждать, пока все картографы завершатся), это то, что делает редуктор во время работы картографа.
Смежные вопросы
- 1. Maui - предотвращение выполнения заданий на одном узле
- 2. hadoop MapReduce job на одном узле Vs Multi node
- 3. Riak MapReduce в одном узле с использованием javascript и python
- 4. cassandra на одном физическом узле
- 5. NetworkTopologyStrategy на одном узле Кассандры
- 6. Последовательность получения информации о узле
- 7. GridGain: MapReduce с локальной обработкой данных на узле?
- 8. Искры на одном узле: улучшение скорости
- 9. Несколько экземпляров Cassandra на одном узле (машине)
- 10. Cassandra Commit и восстановление на одном узле
- 11. Python Цепи Цепи сельдерея на одном узле
- 12. Разделитель, похоже, не работает на одном узле?
- 13. JCR SQL2 сравнивает свойства на одном узле
- 14. Установить WSO2 Stratos 2.0 на одном узле?
- 15. Два одновременных задания на одном узле
- 16. mapreduce: может уменьшить фазу «испускать»?
- 17. Последовательность выполнения Javascript
- 18. Вложение больших файлов в Hive на одном узле Hadoop
- 19. Задача Hadoop Mapreduce не выполняется на подчиненном узле
- 20. Makefile: последовательность выполнения Makefile,
- 21. Task.Factory.StartNew гарантированная последовательность выполнения
- 22. Последовательность выполнения Singleton
- 23. MapReduce при ошибке выполнения Cassandra
- 24. C# Странная последовательность выполнения
- 25. Последовательность выполнения кода
- 26. Последовательность выполнения css-файлов
- 27. Какова последовательность выполнения потоков?
- 28. (Java) последовательность выполнения
- 29. fork() последовательность выполнения?
- 30. Shell Последовательность выполнения сценария
Как эта концепция объединения и слияния до завершения работы Mapper работает в многоузловом кластерном сценарии? Все значения, относящиеся к одному ключу, должны быть переданы только одному редуктору. –
@MitalAwachat - это задача разделителя, по умолчанию хеширует ваш ключ, поэтому он гарантированно приземляется в том же разделе редуктора. –
Также стоит отметить, что вызовы reduce() не происходят до тех пор, пока фаза уменьшения не достигнет 66% (т. Е. Когда тасование и сортировка завершены). –