2016-02-25 3 views
13

Я использую Kafka Server 0.9 с потребительской версией kafka-client 0.9 и kafka-maker 0.8.2.Kafka Consumer Marking координатор 2147483647 dead

Каждая вещь работает прекрасно, кроме я получаю много информации о том, что координатор мертв на потребителя

2016-02-25 19:30:45.046 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.048 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.049 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.050 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.051 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.052 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.053 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.054 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.055 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.056 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.057 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.058 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.059 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.060 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.061 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.062 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.062 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.063 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.064 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.065 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.066 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.067 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.068 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.068 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.069 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.070 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.071 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.072 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.072 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.073 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.074 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.075 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.075 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.076 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.077 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.078 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.079 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.079 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.080 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.081 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.082 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.083 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.083 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.084 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.085 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.086 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.086 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.087 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.088 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.089 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.089 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.090 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.091 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.093 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.094 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-02-25 19:30:45.094 INFO 10263 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 

Я также заметил, что производитель испытывает разрыв подключения через каждые 10 минут, как ниже

2016-03-12 15:55:36 INFO [pool-1-thread-1] - Fetching metadata from broker id:0,host:192.168.72.30,port:9092 with correlation id 41675 for 1 topic(s) Set(act) 
2016-03-12 15:55:36 INFO [pool-1-thread-1] - Connected to 192.168.72.30:9092 for producing 
2016-03-12 15:55:36 INFO [pool-1-thread-1] - Disconnecting from 192.168.72.30:9092 
2016-03-12 15:55:36 INFO [pool-1-thread-1] - Disconnecting from kafkauk.XXXXXXXXXX.co:9092 
2016-03-12 15:55:36 INFO [pool-1-thread-1] - Connected to kafkauk.XXXXXXXXXX.co:9092 for producing 

это моя конфигурация производитель

metadata.broker.list=192.168.72.30:9092 
serializer.class=kafka.serializer.StringEncoder 
request.required.acks=1 
linger.ms=2000 
batch.size=500 

и с onsumer конфигурации

bootstrap.servers: kafkauk.xxxxxxxx.co:9092 
group.id: cdrServer 
client.id: cdrServer 
enable.auto.commit: true 
auto.commit.interval.ms: 1000 
session.timeout.ms: 30000 
key.deserializer: org.apache.kafka.common.serialization.StringDeserializer 
value.deserializer: org.apache.kafka.common.serialization.StringDeserializer 

Я не мог понять, что же это значит, и я должен игнорировать их или я что-то отсутствует в конфигурации


После того, как я изменить Кафка на уровне отладки на потребителя я нашел ниже

2016-03-13 18:21:55.586 DEBUG 5469 --- [  cdrServer] org.apache.kafka.clients.NetworkClient : Node 2147483647 disconnected. 
2016-03-13 18:21:55.586 INFO 5469 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Marking the coordinator 2147483647 dead. 
2016-03-13 18:21:55.586 DEBUG 5469 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Issuing group metadata request to broker 0 
2016-03-13 18:21:55.586 DEBUG 5469 --- [  cdrServer] org.apache.kafka.clients.NetworkClient : Sending metadata request ClientRequest(expectResponse=true 
, callback=null, request=RequestSend(header={api_key=3,api_version=0,correlation_id=183025,client_id=cdrServer}, body={topics=[act]}), isInitiatedByNetworkCli 
ent, createdTimeMs=1457893315586, sendTimeMs=0) to node 0 
2016-03-13 18:21:55.591 DEBUG 5469 --- [  cdrServer] org.apache.kafka.clients.Metadata  : Updated cluster metadata version 296 to Cluster(nodes = [N 
ode(0, kafkauk.xxxxxxxxx.co, 9092)], partitions = [Partition(topic = act, partition = 0, leader = 0, replicas = [0,], isr = [0,]]) 
2016-03-13 18:21:55.592 DEBUG 5469 --- [  cdrServer] o.a.k.c.c.internals.AbstractCoordinator : Group metadata response ClientResponse(receivedTimeMs=1457 
893315592, disconnected=false, request=ClientRequest(expectResponse=true, callback=org.apache.kafka.clients.consumer.internals.ConsumerNetworkClient$RequestFu 
[email protected], request=RequestSend(header={api_key=10,api_version=0,correlation_id=183024,client_id=cdrServer}, body={group_id=cdrServer}), c 
reatedTimeMs=1457893315586, sendTimeMs=1457893315586), responseBody={error_code=0,coordinator={node_id=0,host=kafkauk.xxxxxxxx.co,port=9092}}) 

Я не уверен, что это проблема сети, потому что это происходит каждые 9 минут точно


Update

Я обнаружил, что непосредственно связано с

connections.max.idle.ms: 300000 

Что бы я поставил тогда я будет разъединен при этом значении

+0

Вы решили проблему? – Nautilus

+0

Пока нет, я хотел проверить сеть, но у меня не было времени для этого – Shahbour

+1

По моему опыту, ручное назначение разделов и внешнее управление смещением в Kafka, хотя и в теории поддерживается, сложны и проблематичны. Это кажется простым, но для стабилизации производства требуется много обходных решений. – toolbear

ответ

0

В моем случае сообщение было в журналах, когда я пытаюсь назначить разделы вручную. После того, как я прочитал в api docs нового потребителя, обратите внимание на следующее:

Возможно также, что потребитель может вручную назначить определенные разделы (похожие на более старого «простого» потребителя) с помощью назначения (коллекции). В этом случае динамическое назначение разделов и координация групп пользователей будут отключены.

То есть, если у вас есть такой код:

KafkaConsumer<String, String> consumer = new KafkaConsumer(props); 
    consumer.assign(Arrays.asList(
      new TopicPartition("topic", 0), 
      new TopicPartition("topic", 1) 
    )); 

затем сообщение «Маркировка координатора 2147483647 мертвых» ставит в наших журналах всегда.

+0

Да, у меня есть это в моем коде, причина, по которой я это сделал, потому что я хочу получите последнее сообщение 1000 при перезапуске. 'TopicPartition partition0 = new TopicPartition (« act », 0); consumer.assign (Arrays.asList (partition0)); ' – Shahbour

+1

Да, с Kafka 0.9 и назначением разделов вручную это сообщение появляется, когда соединение простаивает слишком долго, однако потребитель неожиданно восстанавливает и продолжает читать сообщения. Чтобы проверить, вы можете установить уровень журнала org.apache.kafka.common.network.Selector для TRACE. – Shannon

4

Marking координатор мертвых происходит, когда есть сеть ошибка коммуникации между потребительским клиентом и координатором (также это может произойти, когда Координатор умирает, и группе необходимо перебалансировать). Существует множество ситуаций (запрос смещения, смещение выборки и т. Д.), Которые могут вызвать эту проблему. Я предлагаю вам изучить, что вызывает такие ситуации.

+1

Я меняю настройки сети, поэтому оба сервера-потребителя находятся в одной и той же локальной сети, но все же я получаю выше – Shahbour

+0

любую идею, как я могу отладить это, поскольку он все еще существует – Shahbour

+0

вы можете предоставить дополнительную информацию? Я могу только указать, что эта ошибка означает базу информации, которую вы предоставляете. – Nautilus

1

Это, в основном, вы не можете добраться до Кафки.
В моем случае я запускал Kafka в бродячем поле, и если я запустил VPN, он обновил
vagrant ip, следовательно, он не смог подключиться к нему.
Возможное решение: В этом случае остановите VPN и начните свой бродягу.

0

Сегодня я столкнулся с этой проблемой и решил ее (временно, могу добавить). Я опубликовал ответ here о том, как я это сделал.

+0

Я не думаю, что они связаны, в вашем случае брандмауэр предотвратил соединение, в то время как в нашем случае клиент отключается и повторно подключается через определенное время. – Shahbour

+0

Вы все еще сталкиваетесь с этой проблемой? Как вы все-таки решили? – Ankush92

+0

Нет, он находится на старом проекте, как я помню в одном из ответов, связанных с определением определенного раздела – Shahbour

4

Я столкнулся с той же проблемой. Наконец, после следовать Шеннона рекомендации о РОЗЫСК журналов, я использовал:

logging.level.org.apache.kafka=TRACE 

Чтобы узнать, что мой клиент пытается решить Euler:9092 в качестве координатора ... Местное название !! Итак, я прокомментировал и изменил listeners и advertised.listeners значения в файле server.properties. Он работает сейчас! :-)

0

Это также может быть связано с долгой фазой остановки мусора. В моем случае я столкнулся с этим сообщением после> 10 сек GC.

Смежные вопросы