2015-05-06 2 views
0

Это вопрос из книги хаупов и ответа, который был 200, но это неверно. Кто-нибудь объяснит?Хранение данных в кластере Hadoop

Предположим, что в вашем кластере Hadoop имеется 50 узлов, в общей сложности 200 ТБ (4 ТБ на узел) выделенного дискового пространства для хранения HDFS. Предполагая конфигурацию по умолчанию Hadoop, сколько данных вы сможете сохранить?

ответ

1

HDFS имеет набор для по умолчанию replication level, следовательно, каждый из ваших данных будет иметь 3-е экземпляры в HDFS если не указано явно в момент создания.

Следовательно, в соответствии с конфигурацией HDFS по умолчанию вы можете хранить только 200/3 ТБ фактических данных.