2016-03-31 4 views
0

Как настроить Cassandra так, чтобы некоторые таблицы не были реплицированы вообще, кроме других? Это действительно хороший вариант для Кассандры?Репликация Cassandra - реплицируйте некоторые данные, но сохраните некоторые локальные

У меня есть группа клиентов (максимум 50), которые будут ежедневно предоставлять данные (~ 50 000 записей на каждого клиента в день, ~ 200 полей на запись). Мне нужно предварительно обработать данные, чтобы локализовать уязвимую информацию локально, а затем объединить данные централизованно для анализа, а затем разрешить отчетность против комбинированного набора данных. Я планирую, чтобы каждый клиент имел локальный узел Cassandra для загрузки необработанных данных (несколько плоских файлов), но я не хочу, чтобы это было реплицировано до завершения обфускации. Могу ли я сделать это с разными табличными пространствами и факторами репликации? Данные могут быть введены с помощью идентификатора клиента как ПК, если это помогает.

ответ

2

Вы могли бы иметь пространство ключей для исходных данных клиента с коэффициентом репликации 1 и сохранить исходные таблицы данных там, а затем имеют затемненные таблицы данных в отдельном пространстве ключей с коэффициентом репликации> 1.

Смежные вопросы