Я пытаюсь оценить базу данных NoSQL (т. Е. Cassandra) с помощью инструмента сравнения производительности YCSB. Для этого мне, очевидно, нужно установить показатели производительности, в которых я буду измерять производительность. Я решаю выбрать Read
, write
и update
. Теперь я совершенно не уверен, что они являются правильными метриками на выбор, или может быть что-то вроде Scale-up
, и/или elastic speedup
стоит выбрать? Пожалуйста, дайте мне некоторое предложение.Показатели производительности в базах данных NoSQL
1
A
ответ
0
Вы упомянули латентность операции (чтение, запись, обновление). Это определенно очень важная метрика, поэтому вы должны разработать тесты, которые показывают, как изменяется латентность в этих сценариях:
- Задержка операции для различных нагрузок (операций в секунду).
- Операционная латентность для различных рабочих нагрузок (учитывайте различные смеси или проценты операций в рабочей нагрузке).
- (Менее важно) Задержка операции для различного распределения популярности ключевых слов.
Кроме того, другие вещи, которые вы можете проверить, являются:
- Упругие убыстрение: Влияние (на операции латентность) добавления серверов в Интернете.
- Отказоустойчивость: Возникновение (при латентности работы) случайных серверов выходит из строя.
- Баланс нагрузки: насколько хороша БД в балансировке нагрузки на серверах, учитывая различные распределения популярности ключевых слов и различные временные локальные нагрузки в рабочих нагрузках.
- Масштабируемость. Как больше или меньше узлов влияет на латентность операции. В этом случае серверы НЕ добавляются в сеть (это будет эксперимент по ускоренному ускорению).
- Если вы используете эксперименты на EC2, то как влияет выбор типа экземпляра EC2 (средний, большой и т. Д.) На производительность.
Кроме того, рассмотрите возможность использования гистограмм или графиков для наблюдения за латентностью, так как построение только средних значений не позволяет измерять изменчивость латентности.
Наконец, взгляните на this VLDB paper для получения дополнительных идей.
Смежные вопросы
- 1. JOINS в базах данных NoSQL
- 2. Эффективность массовой вставки в базах данных NoSQL
- 3. Эффекты согласованности в распределенных (NoSQL) базах данных
- 4. Показатели производительности Dynatrace
- 5. Вставить показатели производительности
- 6. Тестирование производительности NoSQL db
- 7. Показатели производительности PHP
- 8. В основном запрос, несколько обновлений в nosql-базах данных
- 9. Играть! 2.0 показатели производительности
- 10. Показатели производительности графического процессора
- 11. Что такое алгоритм обработки больших массивов в базах данных NoSQL
- 12. Как применять внешние ключи в базах данных NoSql (MongoDB)?
- 13. Какова наилучшая стратегия хранения документов в базах данных NoSQL?
- 14. Различия в базах данных NoSQL и вероятности проблем с несоответствием
- 15. Ресурсы для получения информации о NoSql/Non реляционных базах данных
- 16. Показатели производительности: Java vs JavaCard
- 17. Показатели производительности WPF Singleton ValueConverters
- 18. Показатели времени/производительности npm-скриптов
- 19. Показатели производительности для iPhone-приложения?
- 20. Показатели производительности регулярного выражения Java?
- 21. Запрос баз данных NoSQL
- 22. Delphi и кодирование производительности. Заявления Показатели производительности и длины кода
- 23. Новичок в базах данных
- 24. Полиморфизм в базах данных
- 25. Показатели производительности C++, интегрированные с Jenkins
- 26. Средние показатели производительности для местных IPC
- 27. AWS EC2 и показатели метрики производительности диска?
- 28. Как вы получаете показатели производительности WCF?
- 29. Структуры данных в базах данных
- 30. Rails/Показатели производительности Q - что быстрее?
Если вы хотите сравнить cassandra, сначала обратитесь к сообщению в блоге, созданному datastax http://www.datastax.com/dev/blog/how-not-to-benchmark-cassandra – bkowalczyyk