Я ищу решение для запуска большого количества задач и мониторинга их состояния в кластере.Выполнение большого количества задач на кластере
Подробно: каждая задача состоит из 3-4 процессов, которые содержат докер (каждый процесс представляет собой команду запуска докера). Все процессы должны выполняться на одном сервере.
Количество задач, о которых мы говорим, это очередные серии из нескольких сотен задач одновременно.
Я посмотрел на несколько решений, все из них на основе Mesos:
- Chronos - Похоже, он будет колебаться при высокой нагрузке и в любом случае более направлен на повторяющемся (CRON) рабочие места. Хотя мне нужна единовременная (тяжелая) работа.
- Пользовательский Mesos FW - Кажется низким уровнем, поскольку для моих нужд мне потребуется написать механизмы планирования и повторного запуска, я бы сохранил это для последней инстанции.
- Aurora - Это кажется многообещающим, поскольку каждая задача выполняется на одном узле и состоит из нескольких процессов. Мне здесь не хватает пары таких: Aurora, похоже, не может выполнять несколько задач как часть одной работы. Поскольку мои задачи похожи на разные входные данные, я мог бы использовать одно задание со многими (скажем 400) экземплярами, и первый процесс каждой задачи (роль которого заключается в загрузке ввода из S3), может загрузить другой набор, основанный на идентификаторе экземпляра , Это подводит меня к другой проблеме: я не могу найти рабочий пример использования {{mesos.instance}} в файлах .aurora, может ли кто-нибудь дать мне пример?
Спасибо за все рыбами людей
Во-первых, спасибо Что касается марафона, я понимаю, что это своего рода init.d для Mesos. Я не ищу службу, а скорее и приложение. Поэтому я не думал, что это подойдет. –
Согласитесь, просто имейте в виду, если это то, от чего вы всегда хотите, чтобы небольшое количество экземпляров запускалось, а затем лопнуло на определенные события (т. Е. Увеличило количество экземпляров), это может быть интересно. – js84