У нас есть кластер Riak с пятью узлами (n_val
- 3), работающий на Amazon EC2, распространяющийся по нескольким зонам доступности. Поскольку у нас нет корпоративной версии, у нас нет роскоши репликации нескольких центров обработки данных и полной синхронизации с другой зоной/регионом.Riak Cluster Backup
Наша текущая стратегия резервного копирования заключается в следующем:
- SSH для каждого узла в кластере, один узел в то время
- Stop Riak услуги с использованием
riak stop
(потому что мы используемleveldb
бэкенд) - Issue мгновенный снимок EBS для объема данных, который имеет данные riak
- Запуск службы riak с использованием
riak start
- Перейдите к другому узлу и повторите выше этапов
Я тестировал этот подход на тестовом кластере с тремя узлами, который не имеет большой активности в реальном времени и не восстанавливается из моментальных снимков без проблем. Я хотел бы узнать от экспертов здесь, подходит ли этот подход для производственного кластера с большой активностью. Будем ли мы сталкиваться с какими-либо проблемами, связанными с эстафетной передачей во время закрытия узла и стартового узла? Есть ли еще что-то, о чем я не знаю в данный момент, что может затруднить шансы на выздоровление, когда произойдет бедствие?
Заранее благодарен!
Именно это я и сделал. Благодаря тонну!! –
Вот сценарий. Подумал, кто-то может найти это полезным: http://www.cynnefo.com/databases/riak-cluster-backup-script-ec2-aws-python/ –