Я строю систему для анализа большого количества финансовых данных по ценным бумагам. Большая проблема в этом заключается в определении того, какой метод хранения следует использовать для данных, данных о том, что данные будут в 10-х годах террабайтов. Будут много запросов на данные, такие как получение средних значений, вычисление стандартных отклонений и суммы, отфильтрованные по нескольким столбцам, такие как цена, время, объем и т. Д. Присоединительные утверждения не являются обязательными, но было бы неплохо иметь.Хранение данных для финансового анализа
Прямо сейчас, я изучаю информацию об общине сообщества индбрайт, monetdb и greenplum для оценки. Пока они кажутся замечательными, но для более сложных функций некоторые из них требуются в некоторых из этих выпусков (с использованием нескольких серверов, операторов вставки/обновления и т. Д.).
Какие решения вы бы использовали для этой ситуации, а преимущества это обеспечивали по сравнению с альтернативами? Экономичность - главный плюс. Если я должен заплатить за решение для хранилищ данных, я бы это сделал, но я бы предпочел бы избежать этого и, если возможно, взять маршрут с открытым исходным кодом/сообществом.
Фактически (parial) суммы, средние значения, stddev - даже при фильтрации - не являются интеллектуальными данными. Это просто статистика **. –
Data mining - это открытие новой информации из набора данных. Статистика - это инструмент, помогающий в этом процессе. Я не думаю, что такой акцент на терминологию является благоприятным, и если мы будем спорить об этом, мы ничего не добьемся.Это похоже на то, что я не согласен с вашим сообщением, потому что вы неправильно использовали статистику как «статистику» - это ненужный акцент на техничности. Моя цель - использовать эту базу данных для обнаружения новой информации. Кроме того, решения для хранилищ данных построены с учетом интеллектуального анализа данных. Поэтому здесь применима концепция интеллектуального анализа данных. – user396404
Однако я согласен с вами в том, что «база данных», вероятно, является лучшим тегом для этого сообщения. – user396404