【深入理解TcaplusDB技术】TcaplusDB日常巡检介绍
作者:互联网
【深入理解TcaplusDB技术】TcaplusDB日常巡检介绍
Tcaplus环境搭建好且投入运营后,日常巡检监控告警, 囊括了Tcaplus方方面面的指标监控, 可以分别配置告警阈值或套用Tcaplus提供的监控模板
设备层面:
-
CPU使用率(总CPU、单个进程CPU)
-
内存使用量(总内存、单个进程内存)
-
磁盘分区使用量(数据盘、binlog盘、日志盘、冷备盘)
-
磁盘分区IO(同上)
-
网络出入带宽使用量
进程层面:
-
Tcapcenter、Tcapdir、Tcapdb对连接MySQL、操作MySQL的成功率统计
-
目录服务器对登录验证的成功率统计
-
接入层对读写请求数、响应数、消息打解包的成功率统计
-
接入层对请求时延的监控
-
存储层对读写请求数、响应数、消息打解包的成功率统计
-
存储层对请求时延的监控
-
存储层对引擎文件的读写成功率统计
-
存储层对DB主从之间DBSeq同步差异、 主从角色切换的监控
-
网络层拥堵的监控
TcaplusDB是腾讯出品的分布式NoSQL数据库,存储和调度的代码完全自研。具备缓存+落地融合架构、PB级存储、毫秒级时延、无损水平扩展和复杂数据结构等特性。同时具备丰富的生态、便捷的迁移、极低的运维成本和五个九高可用等特点。客户覆盖游戏、互联网、政务、金融、制造和物联网等领域。
标签:巡检,存储,Tcaplus,成功率,TcaplusDB,日常,监控,CPU 来源: https://www.cnblogs.com/shujurener/p/16252943.html