Я пытаюсь определить, насколько подходящей Cassandra для моего приложения, так как неизвестно, сколько нам нужно будет масштабировать в будущем и может произойти быстро. Я наблюдал за различными сегментами C * Summit 2013.Cassandra производительность обновления строк с течением времени
В частности, Axel Liljencrantz, разработчик Backend Developer, Spotify, says here, что вы можете ожидать, что производительность Cassandra со временем ухудшится, если ваша модель требует обновления одной и той же строки и над.
Мое требование к модели - тип типа «хранилище документов» с известными полями со значениями, которые меняются в течение нескольких месяцев, так как он соответствует различным реальным требованиям/статусным точкам. Различные запросы и подсчеты должны выполняться в разных хранимых документах.
Итак: Существуют ли какие-либо подходящие способы смягчения этого, если все документы обычно имеют одинаковую известную среднюю продолжительность жизни до того, как они останутся фиксированными, историческими данными?
Неплохо ли это обойти это, сохранив номер версии и переписав весь документ в новую строку при обновлении информации?
вы можете уменьшить это путем полного/крупного уплотнения. Но это то, что я рекомендую только в том случае, если набор данных довольно мал (<10 ГБ), и вы понимаете, что означает крупное сжатие. – Schildmeijer