я вовлечен в проект с 2-х фаз и я задаюсь вопросом, если это большой проект данных (я новичок в этой области)Является ли этот сценарий большим проектом данных?
На первом этапе у меня есть такой сценарий:
- я должен собрать огромную Amont данных
- мне нужно хранить их
- мне нужно создать веб-приложение, которое показывает данные для пользователей
Во втором р hase Мне нужно проанализировать сохраненные данные и построить отчет и провести анализ по ним
Пример использования данных; в один прекрасный день я, возможно, придется собирать и хранить около 86.400.000 записи
Теперь я думал такого рода архитектуры:
- для Colect данных Некоторые асинхронные TECNOLOGY как Активный MQ и протокол MQTT
- для хранения данных я думал о NoSQL БД (Монго, Hbase или другой)
Теперь это будет решать мои первые фазовые проблемы
Но как насчет второй фазы?
Я подумывал о некоторых больших данных SW (например, hadoop or spark) и некоторых машинах, изучающих SW; так что я могу получить данные из БД, анализировать их и строить или хранить в лучшую сторону для того, чтобы построить хорошие отчеты и сделать некоторые конкретный анализ
мне было интересно, если это лучший подход
Как бы вы решить такой сценарий? Правильно ли я?
спасибо
Angelo
http://stackoverflow.com/questions/35560823/what-is-big-data-what-classifies-as-big-data/35561146#35561146 –