睿象云运维告警管理—多渠道的通知必达
作者:互联网
睿象云智能告警平台CA中通知策略实现了被分派人接收告警的通知方式,确保告警发生/认领/关闭时,能以用户习惯的接收告警的方式,实时收到告警通知,同时,尽可能减少告警遗漏。
如果你想实现电话、短信、微信、邮件、APP,5种通知方式,您需要:
• 个人信息中,填写正确的电话号码;点击右上角 个人中心可修改手机号
• 个人信息中,填写正确的邮箱地址;点击右上角 个人中心可修改邮箱
• 个人信息中,绑定并关注 Cloud Alert 微信公众号;
扫描下方二维码,下载APP,安装,登陆。
为满足大部分客户的个性化通知需求,通知策略包含6个部分:
1.告警状态;
2.通知时间;
3.告警级别;
4.延迟策略;
5.通知方式;
6.通知人。
告警状态
• 发生时:告警发生/trigger时,如果被分派人想收到告警通知,可以设置发生时通知;
• 确认时:在CA平台 PC端、微信端、APP端点击 认领 按钮告警后,意味有人认领/ack告警了,如果被分派人想收到确认告警信息,可以设置确认时通知;
• 关闭时:告警解决/resolve后,如果被分派人想收到告警关闭信息,可以设置关闭时通知;
通知时间
可以根据用户实际工作时间,设置不同的通知策略,可设置告警在任何时间发生,均通知;可设置告警在工作时间发生,才通知;可设置告警在非工作时间,才通知。例如,在工作时间时刻在电脑前,设置个邮件通知就够了,但是非工作时间,不在电脑前,可以设置电话/短信通知。
例如:
• 工作时间为:周一-周五的9:30-18:30;
• 非工作时间:周一-周五18:31-9:29及双休日全天;
• 自定义工作时间如下所示。
自定义工作时间
• 操作路径:管理员(admin)可在【通知策略】的右上角自定义工作时间;成员(user)仅可查看不能编辑;
• 设置工作时间:起始日期(包含)- 结束日期(包含);起始时间(包含)- 结束时间(包含);
告警级别
CA平台支持3个级别:严重、警告、提醒。如果您的监控工具有多个级别,也会默认转换成这三个级别。
其他监控工具告警级别对应关系如下:
• Grafana 所有告警默认严重级别 | status=ok 为恢复告警;
• Aliyun 所有告警默认严重级别 | alertState=OK 为恢复告警;
• AWS 所有告警默认提醒级别 | NewStateValue=ok 为恢复告警;
• Cacti 所有告警默认严重级别 | subject包含NORMAL或是包含
• normal或是包含Restored 为恢复告警;
• Site24x7 所有告警默认严重级别 | status=up 为恢复告警;
• 邮件集成 所有告警默认警告级别。
延迟策略
CA平台支持告警状态变化立刻通知,也支持多样化的延迟通知设置,以下场景时建议您使用延迟策略:
• 不重要的告警,如提醒级别,在非工作时间,无需立刻通知,设置延迟12小时,在工作时间处理即可;
• 重要的告警,如严重级别,设置立刻通知,可能有漏看信息错过告警,可以设置延迟5分钟再次通知;
• 重要但不紧急的告警,如警告级别,设置延迟2小时再通知。
通知方式
CA平台支持5种通知方式:电话、短信、微信、邮件、APP。
通知人
admin 可以统一管理(新增、编辑、删除、查看)所有人的通知策略,user 仅能管理自己的通知策略。所以通知人处,user默认选择本人,admin可以一次性配置多人。
功能详情见视频:http://video.aiops.com/CA.notice.mp4
睿象云(AIOps)智能告警平台 CA ( Cloud Alert ) 快速接入各类告警信息,通过人工智能算法自动聚类告警降噪,并配合分派策略、排班机制,以多种方式通知告警到相关人员,全面提升告警管理能力
来源:http://support.aiops.com/hc/kb/article/1389735/
标签:通知,CA,必达,时间,睿象,设置,告警,级别,云运维 来源: https://www.cnblogs.com/lambda2019/p/13054736.html