Hadoop является в основном коллекция Java программного обеспечения, которое в основном обеспечивает две вещи:
- распределенной реализации файловой системы.
- Рамка для записи и бега Карта Сокращение заданий, написанных на Java.
Многие вещи построены поверх этих двух частей (например, HBase, который, вероятно, является столбчатым хранилищем данных, о котором вы читали).
Хороший ресурс для получения дополнительной информации о Hadoop - это apache project page documetation. Если это выглядит запутанным, есть также книга под названием «Hadoop: The Definitive Guide», которая довольно хорошо читается.
Если вы хотите прочитать о том, как все это началось, я рекомендую прочитать this google paper, на котором Hadoop основана
Надежда, что помогает.
Ваша вторая ссылка - 404, и ни один из Hadoop не является базой данных. –