У нас установлен кластер с 6 подчиненными узлами. Я пытаюсь понять, как происходит репликация, когда умирает один из DataNode.DataNode автоматически перезапускается в кластере CDH5
Я вошел в один из подчиненных и убил DataNode с помощью команды kill -9. Спустя некоторое время DataNode перезапускается автоматически, и HDFS возвращается в здоровый статус. Я проверяю это, потому что PID из DataNode изменился.
Я не вижу никакой документации по описанному выше поведению DataNode. Это функция Apache Hadoop или Cloudera CDH? Приветствуется любая ссылка на документацию.
получил - thnx - я не мог обработать ни одной документации - поэтому я не был уверен, что это cloudera или функция apache. –
Хм, я был уверен, что скрипты типа 'start-dfs.sh' перезапустит новый процесс в случае сбоя, но я не вижу этого, когда читаю скрипт сейчас. Я удаляю свой ответ. –