Моделирование данных - это немного перегруженный термин, но в контексте вашего желания моделировать/форматировать данные таким образом, который вам пригодится, похоже, что это может быть жизнеспособным подходом. Остальная часть этого находится в этом предположении.
В то время как NiFi использует поток данных через принципы и дизайн, тесно связанные с потоковым программированием (FBP) в качестве средства, функция заключается в получении данных от точек A до B (и, возможно, обратно). Разумеется, системы не по своей сути говорят в тех же протоколах, форматах или схемах, поэтому необходимо что-то форматировать данные в том, что потребитель ожидает от того, что производитель производит. Это приводит к общим схемам интеграции предприятий (EIP) [1], таким как посредничество и маршрутизация. В более широком смысле, это просто получение данных тем, кто в ней нуждается (системы, пользователи и т. Д.), Когда и как им это нужно.
Джо Витт, один из создателей NiFi, дал отличный разговор, который может соответствовать этой идее формирования данных в контексте Data Science на Meetup. Слайды из которых доступны [2].
Если у вас есть дополнительные вопросы, я хотел бы указать вам, чтобы просмотреть списки рассылки сообщества [3] и задать дополнительные вопросы, чтобы вы могли копать больше и получить более широкую перспективу.