2017-02-08 2 views

ответ

1

Это должно быть возможно. Dataproc запускает обычные виртуальные машины вычислительного двигателя для вас и настраивает Hadoop и YARN.

Вы можете зайти на любой компьютер, установить собственную сборку искры и указать установку YARN и Hadoop (Dataproc). Однако я сомневаюсь, что вы сможете использовать консоль GCP или интерфейс командной строки dataproc для отправки и мониторинга заданий с помощью собственной установки без дополнительной модификации.

+0

Возможно, вы захотите использовать действие init, чтобы убедиться, что все узлы используют вашу версию искры и не пытаются загрузить предустановленную искру. Действия Init - это в основном произвольные скрипты, которые выполняются на всех узлах. https://cloud.google.com/dataproc/docs/concepts/configuring-clusters/init-actions –

Смежные вопросы