更新时间:2024-04-11
1、功能简介
运维人员期望运维、管理设备可以帮助其第一时间知悉网络中出现了哪些故障,并可帮助其快速定位问题,但在实际场景中,传统的IT运维产品并不能很好地解决运维人员的这个需求,告警信息给运维人员帮助不大,反而带来了比较大的处理负担,所以有不少运维人员无奈之下只好把告警功能关掉了。
为帮助客户解决上述问题,全网智能2.0推出了事件中心模块,作为运维人员处理事件(本模块所说的“事件”,特指会影响到业务的异常,即优先级较高的异常)的一个重要入口。该模块基于事件关联分析技术以及智能降噪技术,实现了:
1)统一入口,覆盖五大类事件且事件支持的灵活配置
2)以事件关联分析、智能降噪等功能,帮助运维人员在海量的异常告警中聚焦高优先级问题、群体故障中的共性问题,把握运维工作的主动,避免被一个又一个报障推着被动响应而头疼医头脚疼医脚IT运维管理人员在接收到告警或用户报障后,他们可以将事件中心作为工作台,高效地了解异常事件的详情、影响,并有序地排查故障原因,获取精准的故障处置建议。
2、功能配置
2.1、开启全景运维功能序列号
1、点击【平台管理】-【序列号】确认序列号是否开通,要正常使用事件中心全部功能,需要确保全景运维和事件中心2个序列号都处于开启状态。
2.2、开启全景运维功能开关
1、点击【全网感知】-【灵眸引擎配置】-【全网智能配置】-【全景运维】中打开全景运维功能和事件中心开关。
2、点击【统计对象】配置需要统计的数据对象,默认设备只统计重点用户的全服务流程,此时若未配置重点用户则无法在事件中心中呈现用户相关数据,若希望查看所有用户的全服务流程需修改统计对象并提交配置。
2.3、创建重点用户
1、点击【全网感知】-【感知对象】-【重点用户】跳转重点用户匹配策略页面,系统默认有一条匹配mac地址库的策略,可根据实际需求创建或修改对应的重点用户策略。
2、点击【默认重点用户策略】对重点用户匹配规则进行编辑,当前支持以下3种方式做对重点用户进行匹配:
(1)匹配用户名:终端认证后,若匹配中用户名将被标记为重点用户,当前仅支持手动输入对应用户名进行匹配
(2)匹配角色:终端认证后,若匹配中角色将被标记为重点用户
(3)匹配MAC地址:将终端的MAC地址添加到MAC地址库中,终端登录时即被标记为重点用户。
注:添加终端MAC地址到MAC地址库可在MAC地址库页面中手动添加或批量上传,也可在在线用户中勾选对应终端加入MAC地址库
2.4、定义事件触发条件
1、点击【全网感知】-【事件配置】-【事件定义】跳转到事件定义页面,可以根据业务实际情况开启或者关闭对应事件的产生,或者根据业务实际情况修改事件触发的条件和阈值。
附:事件类别和对应事件说明
事件类别
|
事件说明
|
群体用户体验型事件
|
在网络运维工作中,经常会出现一个故障影响到多个用户,这种故障就叫做群体故障,简称“群障”。受群障影响的各个用户,都可能向IT运维人员报障,但故障背后的原因是同一个,如果IT管理员一个用户一个用户地去跟踪处理,会降低故障处置的效率。
事件中心支持自动识别群体用户体验型群障事件(用户可以调整群体用户体验型事件的阈值),如多个终端认证失败、认证过慢、业务访问不了、业务访问过慢等会,以便运维人员将共性问题聚类后统一处理,运维人员被多人的报障误导,影响了排障效率。
|
重点用户体验型事件
|
自动检测到的重点用户出现的个体体验异常事件,如终端认证失败、认证过慢、业务访问不了、业务访问过慢等情况
|
设备指标型事件
|
自动检测到的各种设备指标异常事件,如AP设备异常、空口异常、控制器异常等情况
|
配置变更型事件
|
自动检测到关于控制器配置和交换机配置的各种关键配置变更事件
|
环境质量型事件
|
自动检测到的各种无线环境隐患和无线环境劣化事件
|
2.5、配置事件告警推送
1、点击【全网感知】-【事件配置】-【通知策略】配置事件告警推送策略,可以根据业务实际情况开启或者关闭对应事件的推送,推送方式可以选择短信推送(需要启用短信服务)或APP推送(NMC需要登录信锐云服务)。
注:可根据实际场景自定义编辑推送内容,占位符内的信息无法修改,其他内容可任意编辑,若使用短信推送通知的内容需要符合短信推送的模板,如添加短信签名等,否则短信会发送失败。
3、功能使用
点击【灵眸驾驶舱】-【事件中心】-【网络事件】可查看设备上触发的所有事件,通过事件中心管理员可解决以下运维场景:
1、查看重点用户发生的体验型事件并在确认问题之后进行消警
2、查看群体用户发生的体验型事件并在确认问题之后进行消警
3、查看设备发生的异常事件并在确认问题之后进行消警
4、查看设备配置变更带来的影响并在确认问题之后进行消警
5、查看无线环境异常的指标数据并在确认问题之后进行消警
6、查看设备感知到的表项异常和指标异常并在确认问题之后进行消警
4、注意事项
1、要正常使用事件中心全部功能,需要确保全景运维和事件中心2个序列号都处于开启状态。
2、需要满足事件定义触发的阈值后才能在事件中心呈现出对应的数据。
3、要上报不同阶段的事件,需要打开多维感知的相应功能,例如,要产生认证群障事件,必须开启认证感知监测;业务群障要产生,必须开启业务质量监测
4、事件列表中的时间,如果是非持续性事件,则取事件的最早触发时间,和问题排查中的【事件时间段】的起点一致;如果是持续性事件,就取的是最近一次事件触发的时间,和问题排查中的【事件时间段】的终点一致
5、事件会以5分钟进行聚合,5分钟内产生的相同事件类型会进行合并;
6、集中转发的网络,不支持产生访问业务阶段失败的事件(包括重点用户事件和群体用户事件)
7、AP网关模式部署,不支持产生访问业务阶段失败的事件(包括重点用户事件和群体用户事件)