Как дымоход будет идентифицировать активный namenode, чтобы данные записывались в HDFS? Без высокой доступности Hadoop у нас будет ip-адрес namenode, настроенный в flume.conf, чтобы данные были легко направлены на HDFS. В то время как в нашем случае Flume должен идентифицировать активные и резервные наменоводы и, следовательно, данные должны быть направлены на активный.Как записать данные в HA Hadoop QJM с помощью Apache FLUME?
ответ
AFAIK невозможно по возможности. Конфигурация HDFS sink
имеет только место для одного Namenode.
Тем не менее, я думаю, вы можете настроить два приемника HDFS (и два канала), каждый из которых указывает на Namenode. Источник поместит копию каждого события в оба канала по умолчанию Replicating Channel Selector
. Таким образом, каждый приемник попытается сохранить данные сам по себе; тот, который указывает на резервный Namenode, не будет сохраняться ничем, пока активный не упадет, и ожидание станет активным.
HTH!
Это работает для меня (Hadoop 2.7.1, 1.6.0 водотоки): Место Hadoop * -site.xml конфигурационные файлы к вам Flume классам
Не уверен, какой из них работает, я поместил ядро сайт, hdfs-сайт, сайт пряжи, mapred-site), но настройки для имени кластера находятся в файле core-site.xml
- 1. Apache Flume без hadoop
- 2. Каковы преимущества и недостатки Hadoop HA QJM и NFS?
- 3. Linux HA vs Apache Hadoop
- 4. Как удалить данные в syslog с помощью apache flume
- 5. Полностью распределенный кластер Hadoop - автоматический отказоустойчивый кластер HA с Zookeeper и QJM
- 6. Развертывание Apache Spark на кластере пряжи Hadoop с возможностью HA
- 7. Apache Flume застрял после exec flume-ng
- 8. сбора журнала logg4j с помощью Apache Flume
- 9. apache-flume-1.5.2 совместим с hadoop-2.5.1 или нет?
- 10. Hadoop HA Namenode удаленный доступ
- 11. Как измерить EPS Apache Flume?
- 12. Hadoop Ha namenode java client
- 13. Как распределить Apache Flume 1.4
- 14. Не могу получить данные twitter с помощью Flume
- 15. Сжатие данных в Apache Flume
- 16. Поток закрывается в twitter4j (Hadoop-flume)
- 17. Как записать зашифрованные данные в HDFS
- 18. namenode ha failover time
- 19. Преимущества Apache Flume
- 20. Apache Flume multiple agent
- 21. Kerberos вопроса интеграции с Hadoop HA
- 22. Apache Flume POC issue
- 23. Apache Flume (twitter)
- 24. Apache Flume: kafka.consumer.ConsumerTimeoutException
- 25. Сложность установки Apache Flume
- 26. Hadoop jobtracker HA с версией 1.1.2
- 27. Скорость выборки Apache Flume
- 28. Как анализировать данные в Flume
- 29. Запуск Spark на пряжу с помощью HA
- 30. Apache Flume подключение к twitter API 401: учетные данные аутентификации