Коэффициент репликации

Я новичок в Hadoop, и я хочу понять, как определить самый высокий коэффициент репликации, который мы можем иметь для любого данного кластера. Я знаю, что параметр по умолчанию - 3 реплики, но если у меня есть кластер с 5 узлами, то какой самый высокий коэффициент репликации я могу использовать в этом случае. Есть ли формула, которой мы должны следовать, чтобы определить коэффициент репликации?Коэффициент репликации

Спасибо

источник

2013-10-03 nj2012

Самый высокий коэффициент репликации, который вы можете использовать, зависит от количества узлов в вашем кластере (как сказал @Tarik, у вас не может быть больше реплик, чем у узлов в вашем кластере), ваше ожидаемое использование (сколько данных у вас есть планировать сохранение) и емкость вашего кластера.

В этом другом SO question есть некоторые расчеты по емкости и использованию хранилища.

источник

2013-10-03 17:43:43 cabad

Благодарю вас, другой пост мне очень помог. – nj2012

Очевидно, что вы не можете иметь больше реплик, чем узлы, как хранить две копии на том же узле бесполезно. Мне кажется, что это верхний предел.

источник

2013-10-03 17:31:49 Tarik

Коэффициент репликации

ответ

Смежные вопросы