У меня есть последовательность заданий mapreduce, которые нужно запустить. Мне было интересно, есть ли какие-то преимущества использования Oozie для этого, вместо того, чтобы иметь «один большой драйвер», который будет запускать эту последовательность?Oozie for mutliple mapreduce jobs
Я знаю, что Oozie может использоваться для запуска нескольких действий различного типа, например. свинг-скрипт, сценарий оболочки, работа с mr, но я заинтересован в том, чтобы разделить две мои работы и запустить их с помощью Oozie или иметь одну банку для этого?
Хорошо, но если я использую Ooozie для планирования либо Кстати, есть ли какая-либо цель разделить выполнение на два шага/действия/узлы или поместить все это в одну банку? – Marko
Зависит от того, что вам нужно сделать, когда шаг A завершается успешно, но шаг B не работает. Oozie разрешает повторный запуск шага B из командной строки или из графического интерфейса. –