2015-04-07 5 views
0

Мы работает 6 узлов Cassandra 2.0.11 кластера с RF = 3 при AWS в одном центре обработки данных через 3Кассандры дискового пространства над головой

Наш средний DataSize AZ составляет около 110GB, и каждый узел имеет 2 80GB диски с raid0 для создания одного 160 ГБ диска.

Мы начинаем видеть, как диск заполняется всякий раз, когда происходит ремонт или последующее уплотнение и больше не могут перебалансировать кольцо.

Пришло ли время горизонтально и перейти от 6 до 9 узлов?

Кажется, что 50GB из 160GB - это много накладных расходов, необходимых для нормальной работы cassandra.

+0

Я хотел добавить, что мы уже используем LCS и проверили, что у нас нет снимков. Мы обнаружили, что было полезно использовать bump compaction_throughput_mb_per_sec с 16 МБ/с до 32 МБ/с. Теперь кольцо стало спокойным, что закончилось сжатие, и мы еще не выполнили никаких ремонтных операций. Мы решили попробовать масштабировать от 6 до 9 узлов. –

ответ

0

Получите больше места на диске, если сможете. В противном случае рассмотрите использование выровненного уплотнения в случае, если вы недостаточно на диске и имеете только небольшую или умеренную нагрузку на запись. LCS может сэкономить значительное дисковое пространство во время уплотнения по сравнению с размерным уплотнением. Также проверьте, можно ли удалить некоторые старые снимки.

0

Прежде всего, найдите основную причину того, что заставляет ваши диски заполняться.

Из того, что вы написали, мне кажется, что нагрузка на кластер слишком высока, что заставляет уплотнение отставать. Это, в свою очередь, приведет к заполнению дисков.

Проверьте tpstats nodetool, чтобы увидеть, есть ли отставание от компромиссов и проверить, сколько sstables находится в ваших Columnfamilies. Если это так, либо масштабируйте горизонтально, чтобы обрабатывать нагрузку, либо настраивать текущий кластер, чтобы он мог обрабатывать загружаемую нагрузку.

Причина также может быть связана с огромным уплотнением, которое наводняет накопитель данных. Я предполагаю, что вы используете стратегию уплотнения размера. Накладные расходы для этого составляют 50% ваших текущих данных в любое время. Поскольку большое уплотнение может временно добавить столько данных.

Один вариант может быть переключен на стратегию выравнивания, поскольку для этого требуется только накладные расходы в размере 10%. Обратите внимание, однако, что LCS намного сложнее на дисках.

Смежные вопросы