2015-01-28 5 views
0

Я прочитал, что колонки Cassandra отсортированы физически. Я чувствовал, что это правильно, если в узле присутствует только одна строка ключа (в одном SSTable). Если такой же ключ присутствует в нескольких SSTables с разными/одинаковыми столбцами, сам узел должен сортировать его после чтения из каждого SSTables. Если это правильно, то станет понятным, как концепция Cassandra с широкими рядами, используемая для сортировки/упорядочения столбцов, станет эффективной.Имя сортировки колонны Cassandra

ответ

1

Вы правы, что Cassandra хранит строки, отсортированные по диску на основе кластеров столбцов. Это уменьшает количество запросов на диске для удовлетворения запроса.

Вы также правы, что раздел может существовать в нескольких SSTables на диске, каждый SSTable будет сортироваться на диске, но когда узел читает раздел, он объединяет значения из каждого sstaqble в памяти + любые значения для этого раздела в memtable.

Уплотнение предназначено для минимизации количества SSTables, чтобы сохранить количество дисков в обратном порядке. Вероятно, диск будет медленнее, чем слияние отсортированных данных.

Смежные вопросы