Я пытаюсь настроить Hadoop постоянно на Amazon EC2. В настоящее время я каждый раз запускаю экземпляры EC2 и настраиваю Hadoop. Есть ли способ избежать этого утомительного шага? Я ищу изображение Hadoop, которое можно загрузить на EC2 и сделать все для меня легким.Где я могу найти AMI для Hadoop на EC2?
Я знаю, что могу использовать EMR для сервисов hadoop. Но я не знаю, как запустить кластер EMR (hadoop), не отправляя поток работы. Я имею в виду, что мне нужен кластер hadoop без каких-либо заданий.
В конечном счете, моя цель - запустить приложения для биоинформатики, такие как Distmap и Seal. Для запуска этих приложений существует множество зависимостей. Поэтому мне нужен бесплатный кластер hadoop для настройки среды и последующего запуска этих приложений. Надеюсь, он ясно, что я пытаюсь сделать.
Спасибо.
Интересно. Я думаю, что это хорошее начало для меня. – Ashwin