Я использую Cassandra для хранения больших данных.Те же данные, хранящиеся в разных таблицах в Cassandra
Чтобы запустить несколько запросов, я боюсь, что мне нужно создать разные таблицы и вставить почти те же данные в эти таблицы.
Будет ли это влиять на производительность?
То, что я сделал прямо сейчас, это чтение одной записи из очереди, толкать ее на пять таблиц, которые я создал в Кассандре. Если записи в одной таблице занимают около 10 М памяти, то в пяти таблицах она займет 50 Мб памяти? Есть ли лучший способ хранить дублированные данные в Кассандре?
спасибо.
Почему вы толкая его к пяти таблиц? Разумеется, не дублирование 5x не спасет память, или если вам не нужно объяснять, что вы имеете в виду лучше! – user2003470
Поскольку для выполнения этих запросов мне может понадобиться построить пять таблиц. – user2513857
Я знаю, как я разработал колонку familis, не очень хорошо. Запросы: select * from where host in ('nj', 'ny'); выберите * из a где user_id в ('122', '134'); выберите * из модуля where («Запрос», «Получить»); выберите * из заказа по метке времени; выберите count (distinct user_id) из a; выберите count (*) order by timestamp; ... Я не знаю, как их объединить в один стол. Параметры в разделе «IN» должны быть первичным ключом. Если я создаю несколько первичных ключей, он всегда выдает исключение. Большое спасибо. – user2513857