Как создать тест, который скажет мне, какие узлы Cassandra записываются, поэтому я хотел бы указать количество узлов и коэффициент репликации и получить обратно, на какие узлы повлияет каждая запись, как результат попытки вставить. это скажет мне, насколько равномерно будут распространяться данные во время выполнения. У меня есть тестовые данные, поэтому мне действительно нужен способ вызвать макет Cassandra, который настроил способ, которым я буду работать в процессе производства, который вернет мне, на какой узел влияет. Я не вижу способа сделать это с помощью инструмента для стресса Кассандры, если я полностью не пропущу его ...cassandra стресс-тестирование распределение записей
1
A
ответ
1
Поскольку вы заинтересованы в том, чтобы знать все узлы, на которые повлиял запрос, я бы рекомендовал посмотреть в отслеживание.
Вот несколько подходов можно принять:
- Использование Cassandra-стресс и трассировку с nodetool settraceprobability на каждом из узлов C * и установить его на более низкое значение, как .01. Это позволит запросить 1% запросов, для которых вы можете наблюдать результаты трассировки в системе через таблицы system_traces.events и session (see this article для получения дополнительной информации об использовании этих таблиц). Трассировка будет включать информацию о том, какой узел использовался в качестве координатора, какие другие узлы использовались в качестве реплик для чтения/записи и сколько времени потребовалось для обработки отдельных шагов. Обратите внимание, что то, как ваше приложение будет обрабатывать данные запроса, может немного отличаться от того, кассандра-стресс, поскольку на запросы узлов влияет ваша конфигурация Cluster. cassandra-stress использует JavaDriverClient#connect. Вы захотите сравнить свою конфигурацию с тем, что делает JavaDriverClient, и понять различия. Вы также можете изменить JavaDriverClient в соответствии с вашим приложением.
- Вы также можете написать тест против своего приложения, которое использует cassandra. Java-драйвер имеет API для включения отслеживания и наблюдения за данными, которые я документировал в a video here. Кроме того, когда вы возвращаете ResultSet, существует метод getExecutionInfo(), который предоставляет информацию, такую как which hosts were tried, но это включает только узлы, которые использовались в качестве координатора, а не все реплики.
Смежные вопросы
- 1. Распределение нагрузки Cassandra - неравномерно 1.2.8
- 2. Распределение диапазона токенов Cassandra с vnodes
- 3. Распределение учетных записей пользователей в N таблицах
- 4. предварительное распределение записей с использованием счета
- 5. Вставить несколько записей сразу в Cassandra
- 6. Написание большого количества записей в Cassandra db
- 7. Моделирование учетных записей Cassandra с индексами
- 8. Доступно ли распределение TestFlight для учетных записей разработчиков Apple Enterprise?
- 9. Сбалансированное хранилище реплик Cassandra
- 10. Извлечение записей с заданным диапазоном метки времени из cassandra
- 11. cassandra не может выбрать более 500000 записей командой CQL
- 12. Как получить 5 лучших записей в cassandra 2.2
- 13. PrestoDB v0.125 SELECT возвращает только подмножество записей Cassandra
- 14. Размер и производительность раздела Cassandra?
- 15. Cassandra - dstat
- 16. Совместное распределение R
- 17. Распределение вероятности со временем?
- 18. Cassandra - Изменение производительности чтения
- 19. Cassandra aggregation
- 20. Cassandra TimeOut?
- 21. получить распределение значений через SQL
- 22. Установить распределение Пуассона в нормальное распределение
- 23. Elasticearch Распределение распределения маршрутизации и распределение осколков
- 24. Одноразовое распределение памяти или динамическое распределение
- 25. COCOA Объекты Распределение/Распределение + Оптимизация памяти
- 26. C# распределение событий
- 27. случайное распределение через SQL
- 28. Рассчитать частотное распределение массива?
- 29. Управление памятью кэша Cassandra
- 30. Скорость случайной скорости Cassandra
проблема, с которой я столкнулась со стрессом, я не понимаю, как ее подавать на свой собственный набор данных. спасибо за сообщение видео кстати, это очень полезно. Я думаю, что трассировка пройдет долгий путь, поняв это. Еще раз спасибо! – Alex
Спасибо! Новый инструмент для стресса, представленный в 2.1, обладает множеством возможностей для стресса против пользовательских схем, я думаю, что некоторые из форматирования немного изменились с момента этого сообщения в блоге, но это было бы хорошей отправной точкой, если бы вы его не видели: http://www.datastax.com/dev/blog/improved-cassandra-2-1-stress-tool-benchmark-any-schema –
проверить это сообщение http://www.sestevez.com/data-modeler/ – phact