2015-07-06 5 views
4

Я немного запутался в доступных API и двух идентификаторах. Я использую boto, но не думаю, что проблема здесь: мой вопрос касается любого api (но не cli).ClusterID vs JobFlowID на AWS EMR

Я запускаю JobFlow с RunJobFlow, который возвращает мне JobFlowId. Предположим, я не хочу содержать номер, но скорее нахожу позже, что работают JobFlows, чтобы добавить к ним шаги.

Я думаю, что я должен использовать DescribeJobFlows, чтобы найти все jobflow_ids и перейти оттуда. Но по документации (http://docs.aws.amazon.com/ElasticMapReduce/latest/API/API_DescribeJobFlows.html) этот вызов api отмечен как устаревший и позволяет нам использовать ListClusters, который возвращает cluster_ids.

Что связывает 2 вместе? Это тот же идентификатор? Если нет, то как я могу получить идентификаторы jobflows из идентификатора кластера?

Я думаю, что путаница также приходит тот факт, что на кли команда является «создать-кластер» и возвращает CLUSTER_ID, и дополнительные шаги также принимает CLUSTER_ID ....

ответ

6

идентификатора кластера и Идентификатор потока работы - это одно и то же (j - ######). Идентификатор кластера является более подходящим названием для его цели, чтобы не путать с терминологией задания, как это видно с помощью Hadoop. Итак, продолжайте использовать ListClusters (http://docs.aws.amazon.com/ElasticMapReduce/latest/API/API_ListClusters.html).