2013-10-03 6 views
1

Я новичок в Hadoop, и я хочу понять, как определить самый высокий коэффициент репликации, который мы можем иметь для любого данного кластера. Я знаю, что параметр по умолчанию - 3 реплики, но если у меня есть кластер с 5 узлами, то какой самый высокий коэффициент репликации я могу использовать в этом случае. Есть ли формула, которой мы должны следовать, чтобы определить коэффициент репликации?Коэффициент репликации

Спасибо

ответ

1

Самый высокий коэффициент репликации, который вы можете использовать, зависит от количества узлов в вашем кластере (как сказал @Tarik, у вас не может быть больше реплик, чем у узлов в вашем кластере), ваше ожидаемое использование (сколько данных у вас есть планировать сохранение) и емкость вашего кластера.

В этом другом SO question есть некоторые расчеты по емкости и использованию хранилища.

+0

Благодарю вас, другой пост мне очень помог. – nj2012

0

Очевидно, что вы не можете иметь больше реплик, чем узлы, как хранить две копии на том же узле бесполезно. Мне кажется, что это верхний предел.

Смежные вопросы