2016-01-02 3 views
1

Я установил среду Hadoop на своем бесплатном уровне AWS. это 1 ведущий-3 ведомый, работающий с hadoop 2.7.1 - Ubuntu 14.04 (не EMR).hbase zookeeper: Какой из них первым пришел на AWS environement?

Я хотел бы перейти к следующему шагу, и похоже, что HBase был хорошей отправной точкой. после того, как читать дальше, я заметил Zookeeper приходит в картину ...

Вопрос: После установки Hadoop, я должен установить и настроить Hbase мульти узел или Zookeeper, а затем Hbase (sqoop, водовода, свинья ... должен следовать завершению этого шага)?

Bonus: Моя цель заключается в подключении R, Tableau как визуализация программного обеспечения и запустить несколько питона программ, чтобы играть с AWS так рекомендации, предложение приветствуются

ответ

2

на основе Apache HBase Documentation, распределенной Apache HBase (TM) зависит от запущенного кластера ZooKeeper. Все участвующие узлы и клиенты должны иметь доступ к запущенному ансамблю ZooKeeper. Apache HBase по умолчанию управляет кластером ZooKeeper для вас. Итак, сначала не нужно устанавливать ZooKeeper.

Я рекомендую использовать Python PyData Modules для визуализации (SciPy и т. Д.), Если вы хотите писать программы на основе python вместо интеграции R или Tableau для Python. Они очень мощные и простые в использовании.

+0

Hi Mobin! спасибо за ваши взгляды на это. Я просматриваю дополнительный материал, и некоторые ребята рекомендуют сначала установить ZK, а не использовать отношение по умолчанию HBase. Здесь аргумент состоит в том, чтобы отделить Zookeper от HBase, если я хочу прекратить использование HBase в будущем. Каковы ваши взгляды на это? Согласен не согласен? – lucTiber

+0

Не согласен. Я привел его из оригинальной ссылки. Какова их ссылка? Они рекомендовали установить, но это не требуется/требуется. Возможно, вам нужно искать плюсы и минусы каждого. –

+0

привет! Спасибо, что поделились своими взглядами на это. Я буду продолжать оценивать вариант. – lucTiber

Смежные вопросы