У нас есть кластер из 12 узлов с двумя центрами обработки данных (каждый DC имеет 6 узлов) с RF-3 в каждом DC.Лучший способ добавления нескольких узлов в существующий кластер cassandra
Мы планируем увеличить емкость кластера, добавив 3 узла в каждый DC (всего 6 узлов). Каков наилучший способ добавления нескольких узлов одновременно (ya, может быть с разницей в 2 минуты).
- auto_bootstrap: ложь - Использование auto_bootstrap: ложь (как это быстрее процесс запуска узлов) на всех новые узлы, запустить все узлы & затем запустить «nodetool восстановить», чтобы получить данные передаются на эти новые узлы из exisitng узлов ,
- auto_bootstrap: правда - Использование auto_bootstrap: верно, а затем запустить один узел в то время, ждать, пока потокового завершения процесса (это может занять некоторое время, я думаю, как мы огромные данные около 600 ГБ + на каждом узле) перед запуском следующего узла. Если я иду таким образом, мне нужно подождать, пока весь процесс потоковой передачи не будет выполнен на узле, прежде чем приступать к добавлению следующего нового узла.
Если я иду таким образом, где запросы на чтение скоро начинаются с этих новых узлов, так как на данный момент у него есть только назначенный им диапазон токенов (новые узлы), но НЕТ данных не передается на эти узлы, это вызовет Сбой чтения запроса/проблемы с CL/любая другая проблема?
ИЛИ
<ол начать = «2»>Просьба предложить лучший способ добавления нескольких узлов одновременно.
PS: Мы используем c * -2.0.3.
Заранее спасибо.
Как я спросил, что произойдет, если я перейду с 'auto_bootstrap: false', как будут обрабатываться запросы на чтение? Они идут к этим новым узлам, так как в этот момент у этих новых узлов будет только назначенный им ряд токенов (новые узлы), но НЕТ данных не будет передано на эти узлы, вызовет ли это ошибки чтения/проблемы CL/любая другая проблема ? Спасибо за ваш ответ * – techpyaasa
@techpyaasa редактирование сделанное. – Aaron
Еще раз спасибо за ваш ответ. Небольшие сомнения в одной из ваших строк. Кроме того, если хотя бы одна копия ваших данных была реплицирована в ваш локальный центр данных (тот, с которым вы соединяетесь с новым узлом), это также является предпочтительным методом ». Будет ли новый узел пытаться извлекать данные из узлов в других центрах обработки данных (кроме того, к которому он относится)? Если да, то почему это так, учитывая, что узлы в своем DC имеют все данные? Или требуется, чтобы кластер был в идеальном состоянии, не нуждаясь в ремонте, во время добавления нового узла? Может ли это быть причиной? – techpyaasa