Учитывая поток данных непрерывно прибывающих элементов, содержащих временную метку и текст (например, журнал запросов поисковой системы), как бы вы храните данные, чтобы вы могли эффективно получать итоговые данные с течением времени для построения тренда строк за семестр?Структуры данных для построения трендов во времени
База данных с привязкой к строкам, подобная (термин, дата, счет), будет работать, но не будет масштабироваться с большим количеством разных терминов. Какие альтернативные структуры данных следует рассматривать в этом контексте (например, хранилище, ориентированное на столбцы)? Быстрые вставки - важное требование.
Что касается вашей точки 2. - таблица без индексов замедлит поиск. Мне нужно ВЫБРАТЬ все итоги за период, чтобы построить линию тренда. Использование файла в качестве буфера для группировки вставок представляется хорошей идеей. – ssn
Это цена, которую вы платите за СУБД. Индексы делают выбор быстрее при стоимости вставок. Похоже, что плоские файлы - это хорошее место для начала. – ligos