Я новичок в hadoop.Hadoop имя узла и узла журнала, потребляющего дисковое пространство автоматически
Я установил мою настройку hbase, используя Cloudera (обычная установка) на 5 серверах. Я создал таблицу и заполнил некоторые данные.
Теперь я контролировал размеры папки hdfs. Я вижу, что узел данных продолжает давать последовательное чтение. Но использование ячеек узлов и узлов узла увеличивается каждый раз, когда я проверяю.
Хотя у меня есть небольшой объем данных, узлы узлов и узлов журнала увеличиваются на 30 МБ (приблизительно)/день.
Я что-то пропустил в конфигурациях?
Вы должны копаться в папках, в которых эти файлы располагаются с помощью 'du -sh' и выяснить, что занимает пространство. Это могут быть журналы, файлы изображений/правки или целое множество вещей. –
Я согласен с Дональдом, проверьте размер журналов, сгенерированных каждый день. –
журналы собираются в отдельную папку. Я вижу, что его активный узел узла имен и узлы журнала суммируют пространство. Я провел некоторое исследование и обнаружил, что всякий раз, когда есть некоторые изменения в узле имени, журнал занимает, а затем вторичный узел имен читает его из журнала. Но здесь я не делаю никаких операций в своей hbase. –