2013-11-12 2 views
2

Я создаю конвейер данных, используя EMR Cluster в качестве ресурса. Как сервер создает после начальной загрузки, Она автоматически выполняет некоторый шаг, которыеКак отключить установочный шаг свиньи из конвейера данных aws

enable debugging, 
Install Hive 
Install Pig 
install Task runner 

Everthing является ОКЕЙ.

Но я хочу удалить шаг Установить свиньи из этого. есть ли способ сделать это?

+1

Я не думаю, что вы можете удалить любой из этих шагов, так как datapipeline устанавливает их для вас. Есть ли причина, по которой вы хотите удалить эти шаги? –

+0

Резонанс - это установка последней версии свиньи автоматически, но ami не поддерживает, поэтому сбой работы – developerCK

+0

Является ли это конкретным ами, который вы используете, или это по умолчанию ami, который предоставляет датапайплайн? Вы можете указать amiId в полях emrCluster, чтобы указать более новую ами, которая поддерживает последнюю версию свиньи –

ответ

-1

Этот ответ рассматривает информацию об ошибке в комментариях.

Похоже, вы получаете очень старую версию Hadoop. Посмотрите на поле hadoopVersion, определенное в объекте EmrCluster, оно, вероятно, говорит «0.20». Я бы сказал, удалить это поле и заменить его amiVersion (http://docs.aws.amazon.com/datapipeline/latest/DeveloperGuide/dp-object-emrcluster.html). Выберите более новую версию, указанную в http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/ami-versions-supported.html.

Смежные вопросы