Я ищу создание базы данных таймсеров Cassandra для хранения миллионов ежедневных ежедневных данных, которые могут потенциально иметь до 100B точек данных.Разработка базы данных таймсеров в Кассандре
Я смотрел на эту статью: http://rubyscale.com/blog/2011/03/06/basic-time-series-with-cassandra/
Эта конструкция очень звук. Поэтому по существу я могу помещать ежедневные временные метки в виде столбцов и, если необходимо, очертить столбцы, добавив день в строку.
Два вопроса у меня есть:
- Я смотрю на хранение до 20000 датируемых (ежедневно) столбцов. Стоит ли даже очертить строки, например. год с этим количеством столбцов? Имеются ли какие-либо преимущества/недостатки для строгания строк, чтобы уменьшить количество столбцов до 365 в год.
- Другая идея, которую я имею, заключается в том, чтобы вместо столбцов по столбцам создавать столбцы на каждый год. Таким образом, при обращении к данным за несколько лет мне пришлось бы запрашивать несколько семейств столбцов, а не одно семейство столбцов, и присоединяться к результатам на стороне клиента. Будет ли этот подход ускорить процесс или, скорее, замедлить все?
Итак, вы считаете, что в окошечных таблицах и семействах столбцов нет точек в отдельных семействах столбцов, но для этого нужно делать строки? Есть ли недостаток, если слишком много строк в одном семействе столбцов? – datageek
Семейство колонок - это просто дополнительный ключевой уровень.Если мои данные имеют одинаковую природу и нужны одинаковые настройки в виде кэширования, сравнения (имена столбцов) и т. Д. Затем я помещаю их в одно и то же семейство столбцов. Плюс колонковые семейства не так просто управлять программно. Просто создайте его для создания нового ключа. И вы не можете читать из отдельных CF в одном запросе. –