2016-07-21 4 views
1

Один из рабочих узлов моего кластера HDInsight Hadoop (Linux) мертв (прекращено отправку пульса). Есть ли вероятность, что HDInsight попытается исправить это? Если нет, каков способ вернуть его онлайн?Как восстановить мертвый узел в кластере HDInsight Hadoop (Linux)?

+0

Вы считали, что обращаетесь к Microsoft? Они могут перезагрузить рабочий узел, чтобы смягчить проблему. –

+0

Это трудоемкий процесс. Я могу удалить и воссоздать кластер, но это произошло много раз, поэтому я хотел понять, есть ли быстрое решение. Даже удаление и повторное создание кластера должно занять некоторое время, но вместо этого, если есть некоторая команда, в которой мы можем вернуть мертвый узел, перезапустить и т. Д., Это предпочтительнее. – Dhiraj

+1

Если это проблема с Azure, то, скорее всего, вы ничего не сможете сделать сами, чтобы перезапустить ее. С другой стороны, если это проблема HDInsight, и, анализируя журналы, вы можете понять проблему, тогда вы, возможно, сможете что-то сделать. Но из описанных вами симптомов это выглядит как лазурная проблема, и вы не можете перезапустить узел, когда вы даже не можете его получить. –

ответ

1

Войдите в узел через ssh, если это не голова ssh к нему из головного узла. После этого на узле перезапустите агент ambari. Агент ambari - это то, что посылает сердцебиение.

+0

Но что, если вы даже не можете подключить (SSH) к узлу, вы не можете запускать какие-либо команды на этом узле, а затем перезапустить агент. Это облачный (Azure HDInsight) кластер. Я пробовал SSHing для узла (из headnode), но я получаю время соединения. – Dhiraj

Смежные вопросы