Linux性能优化从入门到实战:21 综合篇:系统监控、应用程序监控
作者:互联网
系统监控
监控系统,要涵盖系统的整体资源使用情况,比如 CPU、内存、磁盘和文件系统、网络等各种系统资源。
监控应用程序,要涵盖应用程序内部的运行状态,比如 进程的 CPU、磁盘 I/O 等整体运行状况、接口调用耗时、执行过程中的错误、内部对象的内存使用等应用程序内部的运行状况。
性能监控的 USE(Utilization Saturation and Errors)法,把系统资源的性能指标简化为三个类别:
(1)使用率,表示资源用于服务的时间或容量百分比。100% 的使用率,表示容量已经用尽或者全部时间都用于服务。
(2)饱和度,表示资源的繁忙程度,通常与等待队列的长度相关。100% 的饱和度,表示资源无法接受更多的请求。
(3)错误数,表示发生错误的事件个数。错误数越多,表明系统的问题越严重。
开源的系统监控工具:Prometheus
https://prometheus.io/docs/introduction/overview/
Prometheus 监控系统通常由 5 部分组成:
(1)数据采集模块:Prometheus targets 数据采集的对象,Retrieval 负责采集数据,支持 Push 和 Pull 两种数据采集模式;
(2)数据存储模块:TSDB(Time series database);
(3)数据查询和处理模块:PromQL 语言;
(4)告警模块:AlertManager,基于 PromQL 语言,通过分组、抑制或者静默等多种方式来聚合同类告警,并减少告警数量;
(5)可视化展示模块:web UI + Grafana
应用程序监控
标签:21,Prometheus,应用程序,采集,系统监控,模块,监控,Linux 来源: https://www.cnblogs.com/qccz123456/p/13054701.html