Я совершенно новый для Amazon Elastic MapReduce. У меня есть потребность в том, что я хочу использовать свой собственный планировщик, который реализован на основе планировщика мощности Hadoop, чтобы запланировать мои задания в Amazon Elastic MapReduce.Планировщик емкости в Amazon Elastic MapReduce
В соответствии с моим нынешним пониманием, для достижения этого, я могу определить только один этап в потоке заданий и передать свой пользовательский файл jar через SSH-соединение к главному узлу. Однако я не могу найти, как редактировать файлы конфигурации xml, такие как capacity-scheduler.xml в главном узле. Кто-нибудь знает, как это сделать?
Кроме того, если я хочу добавить на него свойство динамического размера, могу ли я динамически настраивать количество узлов задачи в кластере, когда работа выполняется в настоящее время? Или на каждом этапе размер кластера должен оставаться прежним? Огромное спасибо.
Для первой ссылки кажется, что «capacity-scheduler.xml» не находится в пределах редактируемого диапазона файлов xml. Более того, кажется, что в следующих документах не упоминается, можем ли мы добавлять примечания во время работы. Я все еще смущен, если Amazon EMR может сделать это. – jyxlcd