2013-09-27 4 views
5

Я знал, что такое Hadoop и что делает. В основном это структура, которая позволяет распределенную обработку больших наборов данных через кластеры компьютеров с использованием простых моделей программирования. Он предназначен для масштабирования от отдельных серверов до тысяч компьютеров, каждый из которых предлагает локальные вычисления и хранение.Какая разница между Hadoop и Cloud Computing?

Я мало знаю о облачных вычислениях. Просто начал об этом разбираться. Во время чтения я узнал, что облачные вычисления или облако - это разговорное выражение, используемое для описания множества различных типов вычислительных концепций, которые включают большое количество компьютеров, подключенных через сеть связи в реальном времени.

Обе концепции кажутся мне такими же. Чем точная разница между ними? Не могли бы вы объяснить мне?

Спасибо.

+0

Это простой вопрос, поскольку я не знаю о облачных вычислениях. Я думаю, что нет необходимости его понижать. –

ответ

11

В самой базовой форме вы можете определить облачные вычисления как процесс доставки вычислительных ресурсов по требованию через Интернет по принципу «оплата по мере необходимости». Это включает в себя все: от приложений до центров обработки данных.

Hadoop, как вы бы прочитали, является просто распределенной платформой. Когда-то люди используют Hadoop в качестве средства предоставления некоторых услуг облачных вычислений. Take, EMR Amazon, в котором используется размещенная инфраструктура Hadoop, работающая на инфраструктуре веб-масштаба Amazon Elastic Compute Cloud (Amazon EC2) и Amazon Simple Storage Service (Amazon S3), которая позволяет нам легко и экономично обрабатывать огромные суммы данных.

Вы можете считать облачные вычисления концепцией или методологией, которой Hadoop не является. Сам Hadoop основан на методологии распределенных вычислений. Это как просить, какая разница между программированием и Java. Программирование - это то, что можно сделать с помощью Java, но определенно Java, само по себе, не является программированием. То же самое верно в случае Hadoop и облачных вычислений.

Краткая история, Hadoop - это платформа, которая поможет вам предоставлять услуги облачных вычислений вашим клиентам.

Надеюсь, это ответит на ваши вопросы.

0

Как предложил @Tariq, облачные вычисления - это сервис (в бизнес-смысле) и концепция предоставления вычислительных услуг на удаленном устройстве, а большие данные - это распределенная структура для большой службы данных, которую может использовать поставщик облачных сервисов.

2

Облачные вычисления - это модель, позволяющая вести повсеместный, удобный и доступный по сети доступ к множеству настроенных вычислительных ресурсов в Интернете или интранете. Он предоставляет такие услуги, как PaaS, SaaS и IaaS. С другой стороны, Hadoop - это проект Apache Software Foundation с открытым исходным кодом, который позволяет распределенную обработку больших наборов данных через кластеры узлов. Это в основном основано на концепциях HDSF и MapReduce. Таким образом, вы можете подумать о Hadoop как платформе, которая работает на облачных вычислениях, чтобы предоставить нам распределенный интеллектуальный анализ данных из-за скорости, с которой данные растут в эти дни. Всего наилучшего!

0

В одной строке: Большие данные получают все виды данных и облачных вычислений, что вы даете конечному пользователю из этих собранных данных. Например, могут быть разные данные датчиков. Компании, занимающейся розничной торговлей, могут не потребоваться данные датчиков, собранные из среды, и наоборот. И, будучи облачным провайдером, у меня есть все данные датчиков; однако, исходя из моего конечного пользователя/клиента, я дам данные датчиков, связанные с розничной торговлей, или я дам данные датчиков, относящиеся к окружающей среде.

0

Hadoop хранить данные, использующие HDFS, и она может быть эффективны получить доступ с помощью MapReduce так облачных вычислений использования Hadoop для хранения данных и обеспечивают гибкий доступ облако конечного пользователя

0

«Hadoop» относится к экосистеме проекты с открытым исходным кодом, которые позволяют экономически эффективные массовые распределенные вычисления на стандартном оборудовании.

«Облачные вычисления» относится к вычислительной модели, в которой ресурсы хранения и обработки (или приложения, построенные на них) доступны из другого места через Интернет. Это также подразумевает «полезную» модель потребления, в которой пользователи платят за использование этих ресурсов.

Итак, Hadoop можно развернуть в облаке (или нет). Они не являются взаимоисключающими.

0

Hadoop не может быть использован для обработки в режиме реального времени или мы можем сказать, что онлайн-обработка. Например, Hive, который является компонентом hadoop и имеет в основном SQL-подобные команды и интерфейс, не может использоваться для онлайн-и базы данных в реальном времени, в отличие от MySQL. Cloud - это обобщенная вычислительная среда, но hasoop - это специализированная технология, использующая парадигму Map-Reduce.

Смежные вопросы