Если вы хотите реплицировать данные из одного кластера в другой, то есть один инструмент kafka под названием MirrorMaker
.
Kafka поставляется с инструментом для зеркалирования данных между кластерами Kafka. Инструмент читается из исходного кластера и записывается в целевой кластер. Данные будут считываться из тем в исходном кластере и записываться в тему с тем же именем в целевом кластере.
Вот синтаксис для запуска MirrorMaker
инструмента:
bin/kafka-run-class.sh kafka.tools.MirrorMaker
--consumer.config consumer.properties
--producer.config producer.properties --whitelist my-topic
Вы можете найти этот скрипт в каталоге установки Кафки. Здесь вы должны указать consumer.properties
ваших source cluster
и producer.properties
вашего destination cluster
. Вы можете использовать белый список, темы которого должны быть зеркалированы с помощью опции --whitelist
.
Вы можете найти более подробную информацию о Mirroring data between clusters
Примечание: MirrorMaker копирует данные в то же topic_name
в destination cluster
в source cluster
Отличный инструмент! Но что, если мне нужны только последние N сообщений из темы T? В нашем случае тема prod слишком велика, и нам нужно только часть ее каждый день (скажем, последние сообщения 1M) для использования в uat env. – pls