Для получения типа настройки, где TBs записей будут записаны на темы KAFKA, какова наилучшая практика использования соединителя KAFKA - разъем HDFS?Лучшая практика использования соединения kafka
Мой экземпляр kafka работает на AWS-хосте a.b.c.d, а мой хаоп-имямен находится на AWS-хосте p.q.r.s. Для целей разработки/POC мы продолжаем сливаться в том же поле, что и экземпляр kafka, работающий, например, на a.b.c.d. Размер кластера HDFS составляет 500 ГБ.
Но для установки типа производства, где размер кластера будет составлять 20-30 ТБ, целесообразно ли сливаться в том же поле, что и экземпляр KAFKA, или в поле Namenode или в отдельной коробке? Сколько отдельного размера диска было бы конфлюентным в таком случае производства?