2014-09-15 3 views
1

Я работал с Кассандрой для немного сейчас, и следовал бенчмаркинг советов, найденных по следующей ссылке:Apache Cassandra - Как подчеркнуть IO

http://www.datastax.com/dev/blog/how-not-to-benchmark-cassandra

У меня есть 4 узлов, работающих Кассандру, и 2 разных узла, которые загружают кластер с помощью собственного инструмента сравнения «cassandra-stress». Я понимаю из-за характера LSM Cassandra пишет, что они вряд ли когда-либо будут связаны с IO, однако, по сообщениям, я ожидал, что смогу подчеркнуть кластер таким образом, что он будет связан с IO. До сих пор мне не удалось приблизиться к тому, чтобы сделать ИО узким местом.

Я увеличил количество одновременных записей/чтений; Я увеличил stream_throughput_outbound_megabits_per_sec, чтобы он не дросселировался; Я увеличил количество клиентов-стрессов cassandra в 3 раза (это просто сделало его более связанным с процессором).

Моя установка на каждом узле Кассандра является отдельным жестким диском для commitLogs, и у меня есть 10-дисковый DAS, настроенный для хранения данных. Я контролировал IO с помощью утилиты iostat от Linux, и я никогда не смогу использовать эти диски где-то около 100%. Кроме того, я уменьшил допустимую память, доступную для размышления Кассандры, которая заставила бы ее чаще сливаться. Ниже показано, как я запускать тест записи стресс:

Кассандры стресс -d 192.168.2.1,192.168.2.2 -n -t 20000000 400 -f 20million_write_1 & Кассандры стресс -d 192.168.2.1,192.168.2.2 -n -t 20000000 400 -f 20million_write_2 & Cassandra Расслабляющий -d 192.168.2.1,192.168.2.2 -n -t 20000000 400 -f 20million_write_3 &

И следующее, как я запускать стресс-теста для чтения:

cassandra-stress -d 192.168.2.1,192.168.2.2 -n 20000000 -t 400 -f 20million_read_1 -o читать & cassandra-stress -d 192.168.2.1,192.16 8.2.2 -n -t 20000000 400 -f 20million_read_2 -o прочитать & Кассандры стресс -d 192.168.2.1,192.168.2.2 -n -t 20000000 400 -f 20million_read_3 -o чтения &

Я делаю это из 2 внешних узла, которые питают 4-узловой кластер Cassandra.

Любые мысли или идеи о том, как я могу эффективно подчеркнуть ИО и сделать его привязанным к IO? Или, возможно, что я здесь делаю неправильно?

Благодарим вас за ваше время и терпение.

Матф

ответ

0

Отдельный commitlog диск и 10 дисков с данными .. Вы "Doing It Right".

Вы можете попробовать смешанные читать & писать рабочие нагрузки с большими значениями, чтобы попытаться увеличить общий ввод-вывод, но вы можете снова найти, что это отлично работает на вашем аппаратном обеспечении.

Смежные вопросы