В Apache NiFi, используя FetchS3Object для чтения из ведра S3, я вижу, что он может считывать весь объект в ведро и по мере добавления. Возможно ли:В NiFi можно ли выборочно читать через процессор FetchS3Object?
- Чтобы настроить процессор на чтение только объектов, добавленных сейчас, а не уже существующих?
- Как я могу заставить его прочитать определенную папку в ведре?
NiFi кажется отличным, просто отсутствуют примеры в их документации, по крайней мере, для популярных процессоров.
Thanks James. Я уже делаю это успешно. Мои вопросы очень специфичны для определенного варианта использования, когда я хочу читать только новые файлы по мере их добавления, а не старые в ведре. – Sammy
ListS3 будет идентифицировать новые объекты. Вы можете позволить ему работать для чтения до «сейчас» и отбрасывать вывод для существующих файлов. – James
Я закончил с помощью ListS3 + FetchS3Object вместе с RouteOnAttribute, где я добавил условие $ {s3.lastModified: ge (1485189600000)} для маршрутизации только недавно добавленных документов. – Sammy