Мы ищем инструмент (желательно с открытым исходным кодом), который помогает нам выполнять сложные запросы (расширенная фильтрация и объединение, без необходимости полного SQL) в режиме реального времени.Комплексные запросы в реальном времени на Cassandra
Предположим, что все данные необходимы в памяти, и мы хотим избежать, по возможности, накладных расходов инструментов уменьшения стоимости карты.
Чтобы быть более конкретным, нам нужно загрузить n разделов одной таблицы и объединить их с помощью столбца кластеризации.
Variables Table:
Variable ID: Partition key
Person ID: Clustering key
Variable Value
Desired output columns:
Person ID, Variable 1 Value, Variable 2 Vale, ..., Variable N Value
Мы можем добиться этого с помощью процесса в памяти нагрузки фильтра присоединиться, но нам было интересно, если есть какой-либо инструмент там с этим прецедентом, охватываемого из коробки и с изрядной производительности.
Мы протестировали Spark, но разбиение коннектора Spark C * основано на первичном ключе, поэтому каждый Идентификатор переменной будет загружен в другом искровом узле, и процесс соединения будет очень медленным (все данные будет путешествовать по всему искровому кластеру).
Любые советы? известных инструментов?
Возможный дубликат https://stackoverflow.com/questions/16790297/inner-join-in-cassandra-cql – Raedwald