2013-04-17 6 views
-1

Почему в этой ссылке: {http://www.ibm.com/developerworks/aix/library/au-cloud_apache/#figure2} в рисунке1 apache hadoop определяется как платформа как служба, но в http://nosql-databases.org он определен как база данных хранилища данных без sql wide?Что это такое?

Я имею в виду, что при работе с hadoop мне нужна база данных тоже?

Заранее спасибо.

+0

Ваша вторая ссылка - 404, и ни один из Hadoop не является базой данных. –

ответ

0

Hadoop является в основном коллекция Java программного обеспечения, которое в основном обеспечивает две вещи:

  1. распределенной реализации файловой системы.
  2. Рамка для записи и бега Карта Сокращение заданий, написанных на Java.

Многие вещи построены поверх этих двух частей (например, HBase, который, вероятно, является столбчатым хранилищем данных, о котором вы читали).

Хороший ресурс для получения дополнительной информации о Hadoop - это apache project page documetation. Если это выглядит запутанным, есть также книга под названием «Hadoop: The Definitive Guide», которая довольно хорошо читается.

Если вы хотите прочитать о том, как все это началось, я рекомендую прочитать this google paper, на котором Hadoop основана

Надежда, что помогает.