Я пытаюсь глотать файлы журналов в hadoop.Oozie сгенерировать набор файлов в каталоге
Я хотел бы использовать oozie, чтобы вызвать мою задачу при проглатывании (написанную искровым), и пропустить имена файлов для моей задачи.
Я ожидаю, что файлы, которые должны быть установлены, как:
/example/${YEAR}-${MONTH}-${DAY}-${HOUR}:${MINUTE}/Log1/Log1.log
/example/${YEAR}-${MONTH}-${DAY}-${HOUR}:${MINUTE}/Log1/Log1.1.log
/example/${YEAR}-${MONTH}-${DAY}-${HOUR}:${MINUTE}/Log1/Log1.2.log
/example/${YEAR}-${MONTH}-${DAY}-${HOUR}:${MINUTE}/Log2/Log2.log
/example/${YEAR}-${MONTH}-${DAY}-${HOUR}:${MINUTE}/Log2/Log2.1.log
/example/${YEAR}-${MONTH}-${DAY}-${HOUR}:${MINUTE}/Log2/Log2.2.log
(и т.д.).
Итак, у меня есть две проблемы: 1. Как получить oozie для генерации всех имен файлов под/example/$ {YEAR} - $ {MONTH} - $ {DAY} - $ {HOUR}: $ {MINUTE}/Log1/и передать его в мое приложение; и
- Как получить oozie для параллельной генерации всех имен файлов под/example/$ {YEAR} - $ {MONTH} - $ {DAY} - $ {HOUR}: $ {MINUTE}/Log2/и передать его второму вызову моей задачи.