Мы оцениваем, можем ли мы перенести из SQL SERVER в cassandra для OLAP. По внутренней структуре хранения мы можем иметь широкие ряды. Нам почти нужно получить доступ к данным по дате. Нам часто приходится обращаться к данным в диапазоне дат, поскольку у нас есть финансовые данные. Если мы используем дату в качестве ключа раздела для поддержки фильтра по дате, мы получаем меньше строк с огромным количеством столбцов. Будет ли это препятствовать производительности, если у нас есть миллионы столбцов для одного ключевого ключа в будущем, когда мы обрабатываем миллионы транзакций каждый день.Производительность Cassandra: меньше строк с большим количеством столбцов и больше строк с меньшим количеством столбцов
Нужно ли иметь некоторые изменения в шаблоне доступа, чтобы иметь больше строк с меньшим количеством столбцов в строке.
Нужна производительность проницательности, чтобы продолжить в любом направлении
благодарит за комментарии. достигая 2 млрд. предельных значений столбца, маловероятно. Это может быть широкий ряд, не подходящий на конкретном диске. Кассандра не обрабатывает такой случай, когда строка не подходит на диске. Он должен передавать данные на другой узел, поскольку выбор узла для сохранения строки является решением внутреннего хранилища. – 107
Разделение данных в Cassandra управляется ключом раздела: с помощью простого и быстрого алгоритма хэширования Cassandra идентифицирует узел, который хранит данные. В этом отношении широкая строка - это единица, она не разделяется между узлами. В конце концов попробуйте ввести другие поля в ключ раздела (например, идентификатор финансового продукта, год или даже месяц, если это имеет смысл). – medvekoma
Если алгоритм хэширования идентифицирует узел, на котором строка не может соответствовать или соответствовать первоначально, но по мере того, как увеличивается широкая строка, тогда кассандра переносит строку на другую машину или нет? – 107