2015-03-05 2 views
0

Предположим, у меня есть 1 ТБ данных и задано значение коэффициента репликации равным 2, тогда он делает 2 реплики, поэтому мне нужно 3 ТБ всего пространства для всего моего кластера -1 ТБ для оригинала и 2 ТБ для реплик или всего 2 ТБ?Фактор репликации в Hadoop BIG-данные

ответ

1

Just 2TB - коэффициент репликации включает в себя все копии данных.

+0

Уверен, что тоже. Hadoop работает над WRite, когда-то прочитал несколько раз. Это означает, что мы можем сначала записывать данные только при загрузке в систему, а затем выполнять только операции чтения с данными? –

+0

HDFS не позволяет обновлять (кроме добавлений) обновления существующих файлов. Вы можете эффективно выполнить обновление, создав измененную копию и заменив оригинал. –

+0

Означает ли это, что лучше использовать Cassandra, если мы должны делать постоянные обновления. Кроме того, какая разница, если каждый раз, когда мы делаем обновление, оно реплицирует и заменяет исходное, имеет ли это какие-либо проблемы с памятью или какие-либо проблемы Другие. –

Смежные вопросы