Я новичок в Hadoop и общей парадигме MapReduce. Я много искал в Интернете относительно переопределения метода setup() в классе Map для доступа к объекту конфигурации. Но из того, что я читал, кажется, что метод setup() всегда называется каждый раз при выполнении задачи.Зачем нам нужен метод setup() в MapReduce, когда мы можем инициализировать параметры в map() или reduce()?
Почему возникает необходимость в отдельном способе доступа к объекту конфигурации и инициализации параметров? Почему мы не можем сделать то же самое непосредственно в map() или reduce() методы?
Хотя оба подхода будут давать результат по мере необходимости в конце, есть ли коэффициент производительности, который входит в картину при выборе какого-либо одного подхода? Заранее спасибо.
Конфигурация задания является глобальной и доступна для узлов, работающих на определенной фазе. Когда конкретный сопоставитель работает на узле, задается настройка класса Mapper, а затем отображается карта с соответствующим разделением. – pifta