Я планирую обновить версию Hadoop версии 1 до версии Hadoop 2. Может кто-нибудь скажет мне (если вы попробовали версию 2-го варианта), есть ли улучшения производительности MR/Hive/Pig вакансии в версии 2 над версией 1?Hadoop version 1 vs Version 2 performance
ответ
Вот заметки от apache. Это основные моменты улучшений.
Вот краткий обзор улучшений как для HDFS, так и для MapReduce.
Федерация HDFS Чтобы масштабировать службу имен по горизонтали, федерация использует несколько независимых Namenodes/Namespaces. Namenodes объединяются, то есть Namenodes являются независимыми и не требуют координации друг с другом. Датаноды используются в качестве общего хранилища для блоков всеми Namenodes. Каждый datanode регистрируется со всеми Namenodes в кластере. Датаноды посылают периодические биения сердца и блокируют отчеты и обрабатывают команды из Namenodes.
Более подробная информация представлена в документе Федерации HDFS.
MapReduce NextGen aka YARN aka MRv2 Новая архитектура, представленная в hadoop-0.23, делит две основные функции JobTracker: управление ресурсами и управление жизненным циклом работы на отдельные компоненты.
Новый ResourceManager управляет глобальным назначением вычислительных ресурсов приложениям, а каждое приложение ApplicationMaster управляет планированием и координацией приложения.
Приложение представляет собой либо одно задание в смысле классических заданий MapReduce, либо DAG таких заданий.
Демон ResourceManager и для каждого компьютера, который управляет пользовательскими процессами на этом компьютере, формирует вычислительную структуру.
Приложение ApplicationMaster для приложений является, по сути, библиотекой, специфичной для структуры, и ей поручено согласовывать ресурсы с ResourceManager и работать с NodeManager (-ами) для выполнения и мониторинга задач.
- 1. Компилятор libstdC++ version vs. system version
- 2. jvm minor version vs compiler minor version
- 3. Version Version
- 4. library- vs. application-version
- 5. Hadoop - Неподдерживаемый майор.minor version 51.0
- 6. Application Paid vs Free Version
- 7. Swift Version 2 Bool
- 8. java -version vs java -fullversion
- 9. Desktop application + SQLite - Version = 1.0.65.0 vs. Version 1.0.104.0
- 10. Ruby version 1.9.3 vs 2.0.0
- 11. Morena version 6 vs 7
- 12. PowerShell remoting vs Host Version
- 13. spring-amqp vs rabbitmq version
- 14. android old vs newer version
- 15. Android + Verisign SSL Version 1
- 16. Maven auto increment version version
- 17. «версия hadoop» работает, но «sudo hadoop version» не работает
- 18. PowerShell Version 2 Invoke-WebRequest
- 19. Android Map version 2 issue
- 20. Обновление symfony 2 version/composer.lock
- 21. Взаимодействие с kinect version 2
- 22. Grails version 2.x selection
- 23. Воспроизвести заголовки scala version 2
- 24. WordPress REST API Version 2
- 25. jquery drill down version 2
- 26. hadoop -version дает мне неправильный результат, почему? Hadoop 1.2.1
- 27. subversion version number question
- 28. Play framework для Java? version 1.x.x или 2.x.x
- 29. 'EntityFramework.Core, Version = 7.0.0.0, использует' System.Linq.Expressions, Version = 4.0.11.0
- 30. Spring Data @Version с JPA @Version
Спасибо за ваш ответ. Я прочитал заметки о выпуске Hadoop v2 и узнал о новых функциях, таких как YARN, MR2 и другие архитектурные изменения. Все, что мне нужно знать, если кто-то сравнил любые задания MR/Hive/PIG на v2 против v1 и узнал о любых улучшениях производительности. – rusho1234