2015-09-18 3 views
2

Запуск Spark 1.3.1 на пряжу и ЭМИ. Когда я запускаю искровую оболочку, все выглядит нормально, пока я не увижу сообщения вроде INFO yarn.Client: Application report for application_1439330624449_1561 (state: ACCEPTED). Эти сообщения генерируются бесконечно, один раз в секунду. Между тем, я не могу использовать оболочку Spark.Spark Shell застрял в YARN Принятое состояние

Я не понимаю, почему это происходит.

+0

вы добавили аргумент -x, когда вы добавили приложение для Spark (во время конфигурации кластера Amazon?) Также вы вручную настраиваете кластер или используете сценарий для обеспечения кластера AWS? –

ответ

1

Реализовано несколько потоковых работ, которые я убил в терминале, но, я думаю, они как-то все еще бежали. Я смог найти их в пользовательском интерфейсе, показывающем все запущенные приложения на YARN (я не смог выполнить запросы на использование в Hive). Как только я убил задания, используя команду ниже, искровая оболочка начиналась, как обычно.

yarn application -kill application_1428487296152_25597 
5

Увидеть бесконечность Принятые сообщения от YARN всегда были верным признаком того, что ресурсов кластера недостаточно для выделения моих заданий/оболочки Spark. YARN будет продолжать пытаться планировать ваше приложение Spark, но в конечном итоге будет тайм-аут, если недостаточно ресурсов станет доступным в течение определенного периода времени.

Предоставляете ли вы какие-либо опции командной строки для искровой оболочки, которая переопределяет предоставленные по умолчанию значения? Когда я прошу слишком много исполнителей/ядер/памяти, YARN примет мой запрос, но никогда не перейдет на Running ApplicationMaster.

Попробуйте запустить искровую оболочку без опций (кроме, возможно, --master пряжи) и посмотреть, прошло ли она.

+0

На самом деле только что запущенная 'spark-shell' без каких-либо опций командной строки – DJElbow

+0

@ DJElbow какие машинные экземпляры вы используете, чтобы мы могли видеть спецификации оборудования? –

+0

Реализовано несколько потоковых работ, которые я убил в терминале, но, я думаю, они все еще работали. Я смог найти их в пользовательском интерфейсе, показывающем все запущенные приложения на YARN. Я также не смог выполнить запросы на куст. Как только я убил задания, используя приложение «пряжа» -kill application_1428487296152_25597', искровая оболочка началась, как обычно. – DJElbow

2

Я думаю, что у YARN недостаточно ресурсов для выполнения заданий.

Пожалуйста, проверьте https://www.cloudera.com/documentation/enterprise/5-3-x/topics/cdh_ig_yarn_tuning.html , чтобы рассчитать, сколько ресурсов вы можете предоставить YARN.

Пожалуйста, проверьте количество ядер и количество RAM, что она находится под контролем следующих переменных:

yarn.nodemanager.resource.cpu-vcores
yarn.nodemanager.resource.memory-MB

+0

Если вы положите эти conf с 'spark-submit', не забудьте поставить' spark.' перед каждой командой. Например, первым стал бы «spark.yarn.nodemanager.resource.cpu-vcores» и второй «spark.yarn.nodemanager.resource.memory-mb» –

Смежные вопросы