2016-06-17 2 views
0

В гипотетическом сценарии есть сотни машин, расположенных по всему миру. Все они генерируют служебные данные, журналы, записи 24x7. Одним из возможных способов использования этих данных является создание отчетов различных типов.Могут ли данные крупномасштабного фиксированного формата квалифицироваться как большие данные?

Вся эта генерируемая информация имеет фиксированный формат и может быть определена с использованием соответствующей реляционной схемы.

Это относится к большим данным только из-за его огромной протяженности?

Как выбрать реляционное или NoSQL-решение для такого рода проблем?

Причина, по которой возникает этот вопрос; в момент, когда мы выходим из земли SQL/запроса, проблемы скорости начинают возникать.

Существует ли известная практика эффективного использования такого рода данных?

ответ

1

Википедия определяет большие данные как «Большие данные - это термин, который является настолько большим или сложным, что традиционные приложения для обработки данных неадекватны». Есть буквально десятки определений больших данных - http://www.forbes.com/sites/gilpress/2014/09/03/12-big-data-definitions-whats-yours, поэтому я бы посоветовал вам не беспокоиться о самом термине и скорее искать решение своей проблемы.

Нет серебряной пули для выбора решения NoSQL/BigData - «лошадей для курсов». Для начала посмотрим на следующие исследования, проведенного R & D инженеров Альторос в - "вендор-независимая Сравнение NoSQL баз данных: Cassandra, HBase, MongoDB, Riak с sharded MySQL" - http://www.altoros.com/vendor_independent_comparison_of_nosql_databases.html. Они использовали «приложение Cloud Cloud Service Benchmark» для сравнения различных NoSQL.

Смежные вопросы