Я хочу иметь возможность создавать кластеры EMR и для этих кластеров отправлять сообщения обратно в некоторую центральную очередь. Для того, чтобы это работало, мне нужно, чтобы какой-то агент работал на каждом ведущем узле. Каждому из этих агентов придется идентифицировать себя в этом сообщении, чтобы получатель знал, в каком кластере это сообщение.Знает ли главный узел EMR свой идентификатор кластера?
знает главный узел это идентификатор (j- * ** * *)? Если нет, то есть ли другая часть идентифицирующей информации, которая могла бы позволить получателю сообщения вывести этот идентификатор?
Я просмотрел конфигурационные файлы в/home/hadoop/conf, и я не нашел ничего полезного. Я нашел id в /mnt/var/log/instance-controller/instance-controller.log, но похоже, что будет сложно выполнить grep. Мне интересно, где экземпляр-контроллер может получить этот идентификатор в первую очередь.
Удивительно, я проверю это! – bstempi
См. Http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/Config_JSON.html – ChristopherB
@jcmannem В этой папке содержится все, что мне нужно. Даже, это позволяет избежать использования API дросселирования AWS. Имя файла для моего использования - /mnt/var/lib/info/job-flow-state.txt Теперь проблема в том, как я могу разобрать этот файл? Знаете ли вы? Если есть, я могу использовать библиотеку Джексона. – devsda