В одной из моих таблиц насчитывается около 20 миллионов строк (которые могут увеличиваться в будущем), которые необходимо обновлять ежедневно.Регулярные обновления на определенном наборе строк ухудшили производительность cassandra
Ранее этот процесс обновления был довольно плавным (пропускная способность около 100 тыс. Обновлений/мин без увеличения нагрузки на машинах). Но после 1 месяца регулярных обновлений производительность сильно ухудшилась. Теперь, даже если я пытаюсь выполнять обновления с низкой пропускной способностью, то есть около 30 000 об/мин, средняя загрузка на машинах становится высокой, а другие запросы также оказываются затронутыми.
Кассандра версия -> 2.0.14
машина конфигурация -> (RAID-1, 1 ТБ, 32core, 64 ГБ ОЗУ), аналогичная 4 машины с коэффициентом репликации 3.
Уплотнительная Стратегия данной таблицы -> SizeTiered
Какие изменения я должен попытаться масштабировать его?
Размер кучи Я сохранил только 8 ГБ. Я попытаюсь добавить больше узлов и монитор. Любые предложения по настройке небольших компьютеров? –
Также я проверил журналы системы cassandra для синхронизации GC, там я обнаружил, что GC для ConcurrentMarkSweep занимает 8 секунд. в среднем. Но его раз в день. Это, возможно, не проблема. –