博睿数据DataView标准化指标管理,助力企业快速制定SLO
作者:互联网
在企业数字化转型的浪潮中,越来越多的企业走向全面化、精细化运营的道路。其中,运维部门往往会通过制定服务等级指标(SLI)来评价服务的健康状态,并通过实现服务等级目标(SLO)来保障企业服务的稳定性,为企业提供强有力的运营支撑。目前,在制定服务等级指标(SLI)时,企业往往面临着数据分散,无法关联定义的问题。当服务出现故障,又面临着登录IT基础设施监控、APM应用性能监控、中间件监控、日志监控等各种监控平台排查监控数据,由于数据没有关联性,故障定位困难,而影响服务等级目标(SLO)达成的问题。
Bonree DataView—打造一体化、标准化运维数据中台
为解决企业运维数据分析困难的问题,Bonree DataView提供了一体化、标准化、可视化的运维数据中台建设方案。通过四个步骤,助力企业快速搭建起全方位的数据分析平台。
步骤1数据集成
DataView提供丰富且快速的数据集成方式,帮助企业将运维数据集中起来,为后续数据分析打下坚实基础。
数据集成方式包括:
1.监控数据采集:通过SmartAgent,采集IT基础设施、容器、数据库、中间件等各种服务组件的监控数据
2.监控平台对接:支持博睿全系产品、Zabbix、Promethus、阿里云监控等监控平台快速对接,获取各监控平台采集的数据
3.数据库连接:连接Mysql、Oracle等数据库获取数据,连接Kafka消息中间件消费数据
4.自定义上报:通过HTTP方式上报数据
步骤2标准化指标、实体管理
不同来源的数据接入后,面临的第一个难题就是,数据格式、数据语言不统一导致的数据使用困难、无法关联的问题。为此,DataView提供标准化的指标、实体管理功能,从两个方面对接入的数据进行标准化处理,功能包括:
1.标准化指标定义:支持将不同格式的数据转为标准化的指标格式:指标名称、指标维度;统一以指标形式获取数据,且支持多维度指标分析。
2.标准化实体定义:支持将不同数据源中相同的分析对象定义为标准化的实体类型;从而支持关联多个数据源中的指标进行分析。
使用举例
表1:某应用,前端采集到的用户请求数据如下:
表2:某应用,服务端采集到的响应时间数据如下:
经过DataView标准化指标、实体定义后,可获取到:
- 2个指标
其中,通过维度的定义,支持获取不同维度的指标统计数据,例如获取某个操作系统的应用前端用户请求次数。
- 1个实体类型
其中,通过数据关联,将应用与表1、表2的指标关联起来,可以同时获取某个时间段,应用的请求次数统计、响应时间统计。
步骤3服务健康度评分模型定义
数据标准化之后,DataView支持对实体类型定义健康度评分模型,可基于实体类型的多个指标来评价其健康状态,帮助企业快速定义服务等级指标(SLI)。
使用举例:
期望配置服务健康度评分计算公式为:平均响应时间得分 * 0.2 + 错误率得分 * 0.6 + Apdex指数得分 * 0.2,其中:
- 平均响应时间(T)得分:
T ≥ 2000,得分 = 0
1000 < T < 2000,得分 = [ 1 -(T - 1000) / 1000 ] * 100
T ≤ 1000,得分 = 100
- 错误率(e)得分 = (1 - e)* 100
Apdex得分= Apdex * 100
步骤4场景化分析流程定义
为满足企业不同场景的数据分析需求,DataView还提供了自定义可视化应用的能力,用户可通过拖拽的方式快速配置可视化仪表盘,并通过自定义组件交互,自定义应用菜单等功能,快速配置出场景化的数据分析应用。
标签:得分,博睿,DataView,标准化,指标,SLO,监控,数据 来源: https://blog.51cto.com/u_14553182/2747035