2012-01-07 2 views
3

Я создал несколько хост-групп в nagios, и каждая хост-группа состоит из нескольких хостов. Хосты несут приложения, которые контролируются служебными проверками, всегда не менее 7 или более для каждого приложения. Таким образом, моя проблема заключается в следующем: когда скажем, что приложение на хосте A в хост-группе «Тестирование» идет вниз, я неожиданно получаю около 7 уведомлений, описывающих, что каждый из 7 элементов управления приложения на хосте A в группе «Тестирование» находится в критическом состоянии.Можно настроить nagios на отправку уведомлений на группу хостов или группу обслуживания?

Что нужно, чтобы настроить nagios - отправить одно уведомление, которое проверяет сервис, например, количество сообщений находится в критическом состоянии на хосте A, а затем максимум одного уведомления о том, что хост-группа «Тестирование» не работает. Таким образом, я не получаю уведомление 7 раз, и я знаю, что мне приходится исправлять проблемы на конкретном хосте в конкретной группе хостов. Таким образом, более ясно, какую проблему решить.

Чтобы добавить еще один пример: Когда приложение на хосте A спускается, и я получаю разрешение, скажем, 10 уведомлений, через несколько секунд http_checks начнет также уведомлять меня, потому что apache не получает данные из приложения, которое не работает. Поэтому я решаю одну проблему и получаю около 20 или более уведомлений. Я бы оценил максимум 4 уведомления. Один из одной проверки сервиса на хосте A и по одному на группу хостов, в которой находится хост A, а затем один и тот же для каждой группы хостов, где находится apache. Или, если они находятся в одной и той же группе хостов, будет всего 2 уведомления вообще.

Если подобная проблема возникает в другой группе хостов одновременно, я снова знаю, что есть две хост-группы с проблемой для исправления. Однако текущая ситуация заключается в том, что я получаю около 50 уведомлений и запутываюсь, с чего начать, и какова настоящая проблема.

Неужели кто-то из вас сталкивается с подобной проблемой? Я долго искал любую подобную тему для решения проблемы. Я попытался использовать зависимости, но не нашел способ настроить nagios к ситуации, описанной выше. Родительские отношения могут использоваться только для хостов. Эскалация вообще не решает эту проблему.

Возможно, я просто пропустил некоторую информацию в документации относительно этой конфигурации. Буду признателен за любые советы.

ответ

1

Nagios может сделать это с проверками зависимостей обслуживания. См.: http://nagios.sourceforge.net/docs/nagioscore/3/en/dependencies.html

Но это настоящая боль, чтобы настроить и сохранить управление. Я нашел, что самым простым решением было использование того факта, что команды NRPE (определенные на целевом узле) могут выполнять почти неограниченное количество фактических проверок. Все через одну проверку обслуживания Nagios. Я собираю все проверки для одного приложения (процесс вверх/вниз, различные логарифмы журналов, журналы и т. Д.), Так что каждое отдельное приложение имеет только одну проверку. Результаты проверки сообщают вам, чья проверка не удалась.

+0

Мне действительно очень нравится эта идея. Это также поможет предотвратить получение спама предупреждениями Nagios. –

+0

Этот вид позволяет вам гибко и информативно использовать различные сервисы для различных проверок. Nagios очень мощный и может обрабатывать множество настроек и конфигурации, а также стыдно избегать этого. – jwg

+1

Я согласен с тем, что Nagios - очень эффективная система мониторинга. Его самая большая ошибка заключается не в том, что она может сделать, а в том, как это должно быть сделано. Многие современные системы мониторинга имеют полные интерфейсы графического интерфейса, которые позволяют командам операций управлять проверками с помощью мыши и перетаскивания. Настройка комплексной унаследованной/зависимой проверки в файлах Nagios .cfg - это кошмар для большинства людей. –

Смежные вопросы