Я действительно пытался сделать SQL Server тем, что, честно говоря, никогда не будет. Мне нужна база данных для моей аналитической работы. БД должна быть быстрой и НЕ нужна вся регистрация и другие накладные расходы, обнаруженные в типичных базах данных (SQL Server, Oracle, DB2 и т. Д.)Столбцы: сравнение базирующихся на столбцах баз данных
Вчера я слушал Michael Stonebraker speak at the Money:Tech conference, и я продолжал думать: «Я не действительно сумасшедший. Там лучший способ! " Он говорит об использовании column stores вместо баз данных, ориентированных на строки. Я перешел на страницу Википедии для column stores, и я вижу несколько проектов с открытым исходным кодом (что мне нравится) и несколько коммерческих/открытых исходных проектов (которые я не совсем понимаю).
Мой вопрос заключается в следующем: В прикладной аналитической среде, как разные базы данных на основе столбцов отличаются? Как я должен думать о них? У кого-нибудь есть практический опыт работы с несколькими системами на базе столбцов? Могу ли я использовать опыт SQL с этими БД, или мне придется изучать новый язык?
В конечном счете, я собираюсь извлечь данные в R для анализа.
EDIT: Меня попросили уточнить, что именно я пытаюсь сделать. Итак, вот пример того, что я хотел бы сделать: Создайте таблицу с 4 миллионами строк и 20 столбцов (5 тусклых, 15 фактов). Создайте 5 таблиц агрегации, которые вычисляют max, min и average для каждого из фактов. Присоедините эти 5 агрегатов к стартовой таблице. Теперь подсчитайте процентное отклонение от среднего, процентное отклонение min и процентное отклонение от max для каждой строки и добавьте его в исходную таблицу. Эти данные таблицы не получают новые строки каждый день, они ПОЛНОСТЬЮ заменяются и процесс повторяется. Небеса запрещают, если процесс должен быть остановлен. И журналы ... оххххх бревна! :)
Что является самым простым в использовании инструментом ETL для LucidDB? Чайник? –
JD, вы наконец дали LucidDB попробовать R? Способ RJDBC работает без проблем с LucidDB? Стремитесь узнать свой опыт. –
Я написал сравнение различных базирующихся на столбцах баз данных здесь: http://www.timestored.com/time-series-data/column-oriented-databases –