У меня есть 4 узла Cassandra с 1 семенем в одном центре обработки данных. У меня около 5 миллионов записей, в которых Cassandra занимает около 4 минут, чтобы читать, где с MySQL, это занимает всего 17 секунд. Поэтому я предполагаю, что в моей конфигурации что-то не так. Так любезно, кто-нибудь дайте мне знать, какие атрибуты конфигурации, поэтому я должен проверить Cassandra.yaml.Cassandra Fast Read Configuration
ответ
Возможно, вы проводите сравнение яблок с апельсинами, если вы читаете все записи 5M от одного клиента.
С MySQL все данные локальны и оптимизированы для чтения, поскольку данные обновляются на месте.
Кассандра распределена и оптимизирована для записи. Записи просты, но чтение дорого, так как все приставки должны быть прочитаны и объединены, чтобы получить текущее значение каждого столбца.
Поскольку данные распределены между несколькими узлами, существует множество накладных расходов на доступ и получение данных по сети.
Если вы использовали Spark с Cassandra и загружаете данные в рабочие Spark параллельно, не перетасовывая его по сети одному клиенту, это было бы более похожее сравнение.
Кассандра, как правило, хорошо глотает большие объемы данных, а затем работает на небольших ее участках (то есть разделяет), а не выполняет операции сканирования таблицы, такие как чтение всей таблицы.
- 1. C# read custom configuration build
- 2. Cassandra read performance
- 3. Cassandra: read/s write/s
- 4. Как использовать весенние данные cassandra & elasticsearch configuration
- 5. Cassandra Read/Write performance - Высокий CPU
- 6. Cassandra read throw exceptions with C# driver
- 7. Cassandra Read Load Различается среди узлов?
- 8. no-warmup option in cassandra-stress read или write
- 9. ЛАГ рамки/Persistent Read Side/Cassandra/DataStax/Table
- 10. Cassandra read consistency of ONE return no data sometime
- 11. Cassandra read latency high даже с кэшированием строк, почему?
- 12. convert spring xml configuration to java configuration
- 13. Fast CGI, Lighttpd, Ubuntu
- 14. Configuration Checker
- 15. virtuemart configuration
- 16. Jest configuration
- 17. Использование инструмента Cassandra cassandra-stress
- 18. window.load document read не запускается
- 19. Постоянный магазин с apache ignite xml configuration
- 20. Java EE fast track (Learning Enterprise Java real fast)
- 21. Сбой Fast с WebClient
- 22. Fast min on span
- 23. Fast Screen Transfer
- 24. Fast Audio Input/Output
- 25. Fast FEM Solvers
- 26. DomContentLoaded Triggering Extremely Fast
- 27. GDI fast scroll
- 28. FAST Search проверить NoIndex
- 29. Fast C++ String Output
- 30. Обучение VB6 FAST
Как записываются записи по узлам? Вы запрашиваете все записи 5M в одном запросе? –
Спасибо Мэтью, что касается разделов, я использую «Murmur3Partitioner» со значениями по умолчанию. Что я делаю, так это то, что я загружаю все данные в инструмент BI, а именно Qlik. Поэтому, чтобы ответить на ваш вопрос, да. – user2597012