其他分享
首页 > 其他分享> > alertmanager 高可用

alertmanager 高可用

作者:互联网

概述

    Alertmanager 支持配置以创建集群以实现高可用性。这可以使用--cluster-*标志进行配置。

   重要的是不要在 Prometheus 及其警报管理器之间负载平衡流量,而是将 Prometheus 指向所有警报管理器的列表。

 

 

 Gossip算法简介

    主要用在分布式数据库系统中各个副本节点同步数据之用

信息同步过程演示

前提设定

 

 

Gossip 的特点(优势)

  1. 扩展性

    • 网络可以允许节点的任意增加和减少,新增加的节点的状态最终会与其他节点一致。

  2. 容错

    • 网络中任何节点的宕机和重启都不会影响 Gossip 消息的传播,Gossip 协议具有天然的分布式系统容错特性。

  3. 去中心化

    • Gossip 协议不要求任何中心节点,所有节点都可以是对等的,任何一个节点无需知道整个网络状况,只要网络是连通的,任意一个节点就可以把消息散播到全网。

  4. 一致性收敛

    • Gossip 协议中的消息会以一传十、十传百一样的指数级速度在网络中快速传播,因此系统状态的不一致可以在很快的时间内收敛到一致。消息传播速度达到了 logN。

  5. 简单

    • Gossip 协议的过程极其简单,实现起来几乎没有太多复杂性。

Gossip 的缺陷

  1. 消息的延迟

    • 由于 Gossip 协议中,节点只会随机向少数几个节点发送消息,消息最终是通过多个轮次的散播而到达全网的,

    • 因此使用 Gossip 协议会造成不可避免的消息延迟。不适合用在对实时性要求较高的场景下。

  2. 消息冗余

    • Gossip 协议规定,节点会定期随机选择周围节点发送消息

    • 而收到消息的节点也会重复该步骤,因此就不可避免的存在消息重复发送给同一节点的情况

    • 造成了消息的冗余,同时也增加了收到消息的节点的处理压力

    • 而且,由于是定期发送,因此,即使收到了消息的节点还会反复收到重复消息,加重了消息的冗余。

     

Gossip 中的通信模式

配置

只需要通过  --cluster.peer=  对端IP即可。

[root@ops alertmanager]# ./alertmanager  --config.file=./alertmanager.yml --storage.path=./data/ --cluster.peer=192.168.168.105:9094 

测试

创建静默规则测试

107服务器创建静默规则

 

 

105服务器查看同步信息

 

标签:Pull,alertmanager,散播,可用,消息,Push,Gossip,节点
来源: https://www.cnblogs.com/yanshicheng/p/15549355.html