2013-11-22 3 views
2

Я новичок в hadoop.Hadoop имя узла и узла журнала, потребляющего дисковое пространство автоматически

Я установил мою настройку hbase, используя Cloudera (обычная установка) на 5 серверах. Я создал таблицу и заполнил некоторые данные.

Теперь я контролировал размеры папки hdfs. Я вижу, что узел данных продолжает давать последовательное чтение. Но использование ячеек узлов и узлов узла увеличивается каждый раз, когда я проверяю.

Хотя у меня есть небольшой объем данных, узлы узлов и узлов журнала увеличиваются на 30 МБ (приблизительно)/день.

Я что-то пропустил в конфигурациях?

+0

Вы должны копаться в папках, в которых эти файлы располагаются с помощью 'du -sh' и выяснить, что занимает пространство. Это могут быть журналы, файлы изображений/правки или целое множество вещей. –

+0

Я согласен с Дональдом, проверьте размер журналов, сгенерированных каждый день. –

+0

журналы собираются в отдельную папку. Я вижу, что его активный узел узла имен и узлы журнала суммируют пространство. Я провел некоторое исследование и обнаружил, что всякий раз, когда есть некоторые изменения в узле имени, журнал занимает, а затем вторичный узел имен читает его из журнала. Но здесь я не делаю никаких операций в своей hbase. –

ответ

1

И после некоторых исследований выяснилось, почему журналы редактирования не очищаются. Его настройки в хауп.

* dfs.namenode.num.extra.edits.retained = 1000000.

Это набор значение по умолчанию. Reference

Смежные вопросы