У меня есть координатор по oozie, который выполняет ряд задач, каждый из которых зависит от результата последнего. Каждая задача выводит датированную папку и ищет выхода своего предшественника с использованиемУпорядочить порядок работы координатора на Oozie
${coord:latest(0)}
Это все работало нормально на моем Dev кластера, когда ничего не было работы; каждые 5 минут oozie будет стоять в очереди на другую работу, и за эти 5 минут предыдущая работа выполнялась так, что когда новое задание было настроено, она увидела нужную ему директорию.
Я столкнулся с проблемами в производственном кластере; задания отправляются, но помещаются в очередь и не запускаются некоторое время, но все равно каждые 5 минут oozie ставит очередную очередность, и на этапе инициализации ей назначается ее «предыдущая» папка, которая не была созданный еще, поскольку его предшественник не работал, поэтому «последняя» функция дает ему тот же вклад, что и предыдущая работа. Затем я получаю 10 заданий, все берут один и тот же вход ...
Что мне нужно - это способ строго запретить следующую работу в последовательности координаторов даже от создания, пока ее предшественник не закончит работу. Есть ли способ, которым это можно сделать?
Спасибо за чтение
Какова частота, которую вы указали для совместного участия? –
Взгляните на эти примеры, https://github.com/yahoo/oozie/wiki/Oozie-Coord-Use-Cases Я не уверен, что это лучшая идея, но myabe вы можете использовать «Работа координатора с тайм-аутами» пример, чтобы установить тайм-аут и устранить сложенные то же задание. –
К сожалению, я пропустил ключевой бит информации там - частота установлена на ежедневной основе, но у нас есть запас старых данных для импорта, так что они планируют задания чаще, чем что, поскольку их номинальное время работы в прошлом. – user1111284