Таким образом, у нас возникли проблемы с балансировкой нашей рабочей нагрузки на нашем текущем кластере, главным образом из-за бюджетных ограничений и невозможности добавления большего количества узлов в это время. До недавнего времени, когда узел уходил в ночное время, это происходило часто, поэтому я часто проводил ремонт nodetool. В последнее время кластер стал более стабильным, и эти сбитые узлы не происходят регулярно, поэтому в минувшие выходные я создал задания cron для ремонта nodetool -pr на каждом узле, который будет запускаться еженедельно. Gc_grace по умолчанию по умолчанию - 10 дней, а максимальные подсказки по умолчанию - 3 часа.Нужно уточнить, как работает ремонт Cassandra nodetool.
Мои вопросы:
- Если мы потеряем узел более чем на 3 часа, что именно происходит с подсказкой/с? Разве это/они больше не существуют?
- Если мы потеряли узел дольше, чем 3 часа, но по какой-то причине не понимали, что узел был таким длинным, что произойдет, если ремонт nodetool -pr будет запущен, а не полный ремонт на сбитом узел?
- Как вы исправите проблему/вопрос из вопроса 2, если это действительно так?
- Есть ли способ проверить, что все узлы значительно согласованы/отремонтированы?
Это еще не произошло (по крайней мере, я так не думаю), но я пытаюсь планировать будущее для наихудшего сценария, так как стабильность нашего кластера может или не может быть потеряна долговременно, поэтому я бы скорее подготовитесь, как я могу.