Мне нужно запустить пользовательскую работу на C++ в качестве карты на Amazon, и планировал использовать потоки Hadoop для этого. Исполняемый файл C++ mapper полагается на десятка пользовательских библиотек, некоторые из которых требуют много времени для сборки.Запуск Amazon EMR с пользовательским AMI?
Я ожидал, что EMR будет поддерживать пользовательские AMI (уже есть один встроенный). Однако после тщательного просмотра документации кажется, что можно запускать EMR только на предопределенных изображениях: http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-cli-commands.html.
Я что-то упустил? Если, действительно, поддерживаются только предопределенные ОИМ, каков наилучший вариант для его запуска? Очевидно, что исполняемый файл находится на s3, но могу ли я на самом деле связать его так, чтобы он не зависел от общих разделов вообще?
Спасибо.