у меня есть структура данных, как, что (посетителей веб-сайта)магазин уникальных посетителей в распределенной базе данных
List(p1,p1,p1,p2,p3,p3,p4,p4,p5...)
один посетитель может посетить 1 -> много раз объемы
данных: около 100 Milions/день
Как насчет того или иного db я могу хранить уникальных посетителей для быстрого доступа (около реального времени), подобного этому
2014-11-15 | p1 | p2 | p3 | ...| pn
Я стараюсь обойти с помощью Кассандры с помощью таблицы так:
CREATE TABLE uniqueVisitor (
key text,
p text,
PRIMARY KEY (key, data)
)
Я думаю, что этот магазин модель не работает очень хорошо, потому что:
Из-за разделение данных этой таблицы , Все данные ключа будут храниться только на одном сервере (с коэффициентом репликации = 1) ==> слишком много запросов на запись могут выбить сервер, который сохранил этот ключ.
Пожалуйста, предложите мне решение (шаблон хранения)
Я хотел бы помочь вам, но я не уверен, что хорошо понял ваш вопрос. В таблице uniqueVisitor, что вы хотите сохранить в поле «ключ»: дата или ссылка на веб-страницу или что-то еще? Аналогично, что такое «p»: это имя посетителя или что-то еще? – Pradyumn
tks за помощь! мне нужен магазин только userId !! Ключ - простая строка даты: пример '2014-12-01' –