2015-07-28 2 views
1

Документация почти точно такая же для both, поэтому мне очень трудно увидеть разницу между ними. На основании этого Q&A, единственным отличием являетсяВ чем разница между вторичным именемNode и узлом контрольной точки?

[...], что контрольно-пропускной пункт узел может загрузить новую копию fsimage файла обратно в NameNode после контрольной точки создания, где в качестве вторичного NameNode не может загрузить [... ]

Это не кажется правильным, так как Secondary NameNode может загрузить новый FsImage, основанный на this и this.

Может ли узел контрольной точки считаться заменой Вторичного имени? Каковы дополнительные преимущества? Был ли код очищен между двумя или что-то в этом роде?

ответ

1

В упомянутом вами сообщении cloudera процесс контрольной проверки четко упоминается как в сценариях HighAvailability, так и в NonHighAvailability. Вторичный узел имен выполняет задачу контрольного наменода в сценарии Non-HA. В другом сценарии HA мы можем использовать резервный namenode для контрольной точки. Таким образом, контрольная точка является скорее концепцией и в зависимости от сценария (HA/nonHA), различные узлы выполняют эту операцию.

Вы можете прочитать этот блог еще раз. И дайте мне знать, нужны ли какие-либо исправления. Счастливое обучение

0

Разница между SNN и контрольной точкой NN заключается в том, что SNN хранит данные локально в файловой системе, но не загружает объединенное fsimage (с журналами редактирования) в Active NN, которое делает контрольная точка NN.

0

Даже документация Apache page не содержит различий. На странице документации кажется, что роль узла вторичного имени & Checkpoint Node кажется схожей.

На другой ноте, я поднял ошибку, чтобы исправить страницу документации, чтобы избежать путаницы: https://issues.apache.org/jira/browse/HDFS-8913

Я надеюсь, что эта ошибка будет решена в ближайшее время.

Что касается вашего второго запроса:

Может Checkpoint узел рассматриваться в качестве замены один-к-одному из вторичного NameNode? Каковы дополнительные преимущества? Был ли код очищен между двумя или что-то в этом роде?

Сделка вещей была изменена с Hadoop 2.x релиз и узел имени не является единственной точкой отказа.

Высокая доступность Активного имя узла с помощью ПОВ по имени узла является ключевой особенностью Hadoop 2.x.

Вам просто нужен активный узел Имени и П по имени узел для достижения высокой доступности.

Hadoop 2.х High Availability было четко объяснено в других вопросах SE:

Hadoop namenode : Single point of failure

How does Hadoop Namenode failover process works?

Смежные вопросы