Отказоустойчивость в Hadoop

Мы знаем в hadoop, если данные развращают новую реплику, будут созданы внезапно, если узел, который был запущен, работает нормально, тогда как namenode имеет дело с 4 репликами, удалит ли он один узел?Отказоустойчивость в Hadoop

Если так, то новый или тот, который внезапно появился?

источник

2015-06-19 karthik

Метаданные старого узла удаляются из Namenode, поэтому даже если поврежденный узел возвращается, узел имени не будет иметь метаданных о хранящихся в нем данных. Следовательно, у Hadoop будет 3 реплики (2 старых и одна новая реплика, созданная после того, как один из старых был поврежден) –

В ситуации, когда один data node идет вниз, name node будет видеть некоторые блоки under-replicated данных и начнет репликацию в другой узел в кластере, чтобы привести репликацию обратно к ожидаемому уровню (по умолчанию 3).

Когда поврежденный узел снова поднимается, все блоки с этого узла будут видны как over-replicated с 4 репликами.

Когда блок становится over-replicated, name node выбирает реплику для удаления. name node предпочитает не уменьшать количество стоек, на которых размещаются реплики, и, во-вторых, предпочитает удалять реплику из data node с наименьшим количеством доступного дискового пространства. Это может помочь перебалансировать нагрузку по кластеру.

источник

2015-06-20 13:43:25 vanekjar

NameNode заботится о блоках репликации, и вам не нужно беспокоиться о сверхреплицированных блоках или делать что-либо вручную.

Namenode удаляет излишне реплицированные блоки из узла с меньшим доступным дисковым пространством .., что в конечном итоге помогает в балансировке кластера.

источник

2015-06-21 03:50:12 hadooper

Отказоустойчивость в Hadoop

ответ

Смежные вопросы