2016-10-19 2 views
1

Отказ от ответственности: Я учусь, и, очевидно, я делаю что-то неправильно. Любая помощь приветствуется!Apache Kafka - Тестирование Отказоустойчивость

Настройка:
Я создал Apache Kafka кластер с 3-мя узлы, используя бродячий (каждый узел имеет отдельный гк и процесс Кафки работает). Я хочу, чтобы проверить отказоустойчивость, поэтому я создал реплицированную тему и когда я описать "это все 3 узлов до:
$KAFKA_HOME/bin/kafka-topics.sh --describe --zookeeper 192.168.33.21:2181 --topic replicated-topic-1 Topic:replicated-topic-1 PartitionCount:1 ReplicationFactor:3 Configs: Topic: replicated-topic-1 Partition: 0 Leader: 1 Replicas: 2,3,1 Isr: 1,2,3

Чтобы проверить отказоустойчивость:
На лидера (узел 1 в этот случай) Я хочу убить процесс, который начал кафку. Таким образом, я считаю, ИДП на лидера, чтобы убить его:
ps -elf | grep server.properties 4 S root 2975 2900 0 80 0 - 10738 ? 15:40 pts/0 00:00:00 sudo /usr/local/kafka/kafka_2.11-0.10.0.0//bin/kafka-server-start.sh /usr/local/kafka/kafka_2.11-0.10.0.0//config/server.properties 0 S vagrant 3438 2900 0 80 0 - 2184 - 15:41 pts/0 00:00:00 grep server.properties

Я полагаю, ИДП убить это 2975. Я использую следующую команду, чтобы убить его:
sudo kill -9 2975 [1]+ Killed sudo $KAFKA_HOME/bin/kafka-server-start.sh $KAFKA_HOME/config/server.properties

Все хорошо до сих пор. Я предполагаю, что процесс кафки над лидером убит. Но описать команда говорит лидер не вниз:

$KAFKA_HOME/bin/kafka-topics.sh --describe --zookeeper 192.168.33.21:2181 --topic replicated-topic-1 Topic:replicated-topic-1 PartitionCount:1 ReplicationFactor:3 Configs: Topic: replicated-topic-1 Partition: 0 Leader: 1 Replicas: 2,3,1 Isr: 1,2,3

Просто, чтобы убедиться, что я убил процесс Кафки, я стараюсь эту команду: ps -elf | grep server.properties 0 S vagrant 3654 2900 0 80 0 - 2183 - 15:45 pts/0 00:00:00 grep server.properties

Я думаю, процесс даже убить, но все 3 узла в кластере kafka все еще работают. Просто попробовать, я убил другого процесса, что бродяга запущен (PID: 3654):
sudo kill -9 3657 [email protected]:~$ ps -elf | grep server.properties 0 S vagrant 3661 2900 0 80 0 - 2183 - 15:50 pts/0 00:00:00 grep server.properties
Но, видимо, начинается снова с другим PID:
ps -elf | grep server.properties 0 S vagrant 3663 2900 0 80 0 - 2183 - 15:50 pts/0 00:00:00 grep server.properties

Что я упускаю. Как я могу убить лидера и проверить отказоустойчивость?

ответ

0

Я только что понял, что я делаю неправильно. Чтобы найти Pid фоновый процесс, который совсем недавно начал (в данном случае это было Кафка) я должен был сделать это:
echo $! 2942
И убить его, я должен был сделать это:
sudo kill $!

Мои кластер действительно является отказоустойчивым ... Удивительный!

Смежные вопросы