Мы хотим запланировать рабочий процесс на основе доступности данных, но нет особой частоты прихода данных. Также может быть несколько повторных запусков данных и, следовательно, несколько версий данных за день, прибывающий в любое время.Координатор Oozie с асинхронным набором данных
Как я понимаю из спецификации, в настоящее время обязательно указывать параметр частоты в координаторе.
Однако мы хотели бы инициировать наш рабочий процесс на основе какого-либо события (прихода данных или создания разделов) только в зависимости от частоты.
Похоже, что это соответствует асинхронному набору данных. Поддерживает ли Oozie набор асинхронных данных?
Вы решили это? У меня тоже есть аналогичное требование. спасибо –