2015-11-10 2 views
15

У меня установлены сигналы тревоги, чтобы рассказать мне, когда мои балансировочные барабаны бросают 5xxs, используя метку HTTPCode_Backend_5XX с статистикой sum. Проблема заключается в том, что sum регистрирует 0 как никакие точки данных, поэтому, когда не выбрасывается 5xxs, сигнал тревоги считается недостаточным. Это особенно неприятно, потому что у меня есть настройка SNS, чтобы уведомлять меня, когда мы получаем слишком много 5xx (состояние тревоги), и когда все возвращается к нормальной жизни. Раздражающе, 0 5xxs означает, что мы находимся в состоянии INSUFFICIENT DATA, но 1 5xx означает, что мы находимся в OK состоянии, поэтому 1 5xx запускает всех, получающих уведомление, что все в порядке. Есть ли способ обойти это? В идеале, я бы хотел, чтобы всего лишь 0 из ничего отображалось как нулевая точка данных, а не без данных (недостаточные данные).Избегайте НЕДОСТАТОЧНЫХ ДАННЫХ в Cloudwatch?

+0

У вас много трафика на ELB? Никакие запросы вообще не должны «быть», что приводит к недостаточным данным о точках данных, в отличие от некоторого трафика, кроме 0 ошибок. –

+0

Да. Там много трафика. Cloudwatch проверяет метрику каждые пять минут, и за это время у меня есть тысячи запросов. – Eli

ответ

3

От March 2017 вы можете отметить отсутствующие данные как приемлемые. Это приведет к тому, что будильник не будет отмечен как НЕДОСТАТОЧНО.

CloudWatch missing data option

+0

Это еще не работает – Anuruddha

1

я просил об этом на форумах AWS два года назад :-( https://forums.aws.amazon.com/thread.jspa?threadID=153753&tstart=0

К сожалению, вы не можете создавать уведомления на основе конкретных изменений состояния (в вашем случае, если вы хотите уведомление при изменении состояния от ALARM на OK, но не в том случае, когда состояние изменяется от INSUFFICIENT до OK). Я могу только предположить, что вы также попросите его, и, надеюсь, он будет в конечном итоге добавлен.

Для показателей, которые часто находятся в состоянии INSUFFICIENT, я обычно создаю уведомления для ALARMS и У меня нет уведомлений на OK для этих показателей - если я хочу подтвердить, что все в порядке, я использую мобильное приложение AWS, чтобы проверить o n вещи и посмотреть, разрешились ли они.

1

У нас была аналогичная проблема для некоторых наших аварийных сигналов. Вы действительно можете избежать этого поведения с некоторой работой, если вы действительно хотите справиться с накладными расходами.

Что мы сделали, вместо отправки уведомлений SNS непосредственно на электронные письма мы создали функцию лямбда и вызвали ее, как только у нас есть уведомление в теме SNS.

Таким образом, у вас будет больше контроля над действиями, которые вы можете предпринять после срабатывания аварийных сигналов. Поскольку контекст предоставит вам и старую государственную ценность.

Хорошей новостью является то, что для начала есть шаблон лямбда. https://aws.amazon.com/blogs/aws/new-slack-integration-blueprints-for-aws-lambda/

Просто выберите тот, который предназначен для отправки аварийных сигналов в облачном режиме. Затем вы можете изменить код по своему усмотрению, либо отпустить слабую часть, либо просто использовать электронную почту, либо сохранить ее в слабом состоянии. (это то, что мы сделали, и оно работает как шарм)

Смежные вопросы