Проект Apache Kafka предоставляет некоторые инструменты для получения информации о предмете и потребителях из Zookeeper. В этом случае вы можете использовать ConsumerOffsetChecker
.
Какой инструмент будет выводить вас, это «смещение задержки», то есть разница между последним смещением в разделе и текущим положением потребителя.
Обратите внимание, что Flink обновляет смещение в Zookeeper примерно на частоте интервала контрольной точки, поэтому информация, которую вы видите, не на 100% точна, поскольку она не учитывает записи в полете. Но это даст вам очень хорошее представление о том, создает ли противодавление, или все идет гладко.
Кстати, если у вас возникло ощущение, что Flink не может потреблять данные из темы по мере ее создания, обратитесь за помощью к разработчикам Flink в списках рассылки. В некоторых экспериментах, которые я сделал недавно, я обнаружил, что потребитель Kafka от Flink может читать с очень высокой пропускной способностью.