Я использую марафон для развертывания моего приложения на мезо-кластере. Недавно я испытал переход на другой ресурс в своем мастер-мезоне и марафоне. При перезапуске мастер смог идентифицировать запуск старых задач на подчиненном устройстве, но не показывал их в панели активных задач, как марафон, зарегистрированный с новым идентификатором фрейма. Как-то можно остановить эти осиротевшие задачи, когда мы перезапускаем мезо-мастер, чтобы их можно было перераспределить с помощью марафона?Остановка или повторная регистрация потерянных задач в кластере mesos
ответ
Вы должны иметь возможность выключить старый интерфейс Marathon и уничтожить все его задачи, используя конечную точку /teardown
на главном сервере Mesos.
Вы используете конечную точку, отправив запрос POST с идентификатором frameworkID в теле. Например:
curl -d 'frameworkId=#' -X POST localhost:5050/master/teardown
Вы можете найти frameworkId вашего старого экземпляра Marathon с помощью одного из основных конечных точек, таких как /frameworks
. Будьте осторожны с использованием frameworkId старого экземпляра Marathon, а не нового.
IMO это только сработало бы, если инфраструктура все еще работает. – Tobi
Если старый фреймворк больше не работает (например, отключена инфраструктура и ее «failover_timeout»), тогда все ее задачи должны были быть убиты в любом случае. По умолчанию марафон использует «failover_timeout» 1 неделю. –
Но что происходит в случае, если мастер не удалось когда-нибудь после того, Возможно ли перерегистрировать старую структуру на новом экземпляре мастера? – t6nand
- 1. Регистрация в кластере
- 2. Выполнение нескольких заданий Spark в кластере Mesos
- 3. Как запустить Hadoop на кластере Mesos?
- 4. Выполнение большого количества задач на кластере
- 5. Настройка Mesos-DNS, закрепленная на кластере мезос
- 6. Обеспечение SLA с помощью Mesos и привилегированных задач
- 7. Повторная остановка и запуск службы Windows
- 8. остановка задач async, выполняющихся параллельно
- 9. Лидерские выборы в кластере Mesos, похоже, не работают
- 10. Контейнеры-докеры с балансировкой нагрузки в кластере Mesos с HAproxy
- 11. Mesos Framework
- 12. Повторная регистрация после обновления сертификата Apple Push
- 13. Повторная регистрация комментариев на блоге Orchard CMS
- 14. Докер-контейнер, работающий на кластере Mesos и работающий с другими контейнерами докеров на кластере (используя марафон)
- 15. Spark Streaming через приемник Kafka на кластере крупного зерна Mesos
- 16. Невозможно запустить ведомый Mesos на кластере с одним узлом
- 17. Невозможно запустить искру-submit с помощью приложения на кластере Mesos
- 18. регистрация/кнопка Войти остановка и лаг
- 19. отдых или повторная инициализация?
- 20. повторная выборка или интерполяция?
- 21. Использование Kubernetes или Apache mesos
- 22. Mesos Framework для оптимального распределения коротких (2-10 секунд) задач
- 23. запуск и остановка демонов/процессов daoop в кластере
- 24. Обработка потерянных данных в восстановительной службе
- 25. Обработка точечного прерывания узлов задач в кластере EMS EMR
- 26. Как улучшить время выполнения для последних задач в автономном кластере?
- 27. UWP (C#) Регистрация фоновых задач Предзаказ Launch
- 28. Java ScheduledExecutorService с Hazelcast для выполнения задач в кластере weblogic
- 29. Как восстановить исполнитель Mesos после сбоя системы Mesos?
- 30. Spark Mesos Dispatcher
Вы управляете своими мастерами и агентами в контейнерах Docker? – Tobi
Нет. Я использую мезо и агенты для развертывания контейнеров-докеров. – t6nand
ИМО реальная проблема в том, что марафон зарегистрирован с новым идентификатором famework. – janisz