首页 > TAG信息列表 > 容灾
阿里云 ACK One 多集群管理全面升级:多集群服务、多集群监控、两地三中心应用容灾
简介: 本文介绍了 ACK One 近期发布的 3 个主要特性,覆盖了多集群管理的 3 个主要场景,跨集群服务发现与访问、多集群全局监控、应用容灾。除多集群管理外,ACK One 更是支持连接并管理任何地域、任何基础设施上的 Kubernetes 集群,提供一致的管理和社区兼容的 API,支持对计算、网络、存阿里云 ACK One 多集群管理全面升级:多集群服务、多集群监控、两地三中心应用容灾
作者:宇汇 ACK One 概述 ACK One 是阿里云面向混合云、多集群、分布式计算等场景推出的分布式云容器平台,能够统一管理阿里云上、边缘、部署在客户数据中心以及其他云上的 Kubernetes 集群,并简化集群管理界面,让企业轻松应对多集群形态,从而灵活地根据自身业务和数据管控等需求,同时使阿里云技术专家邓青琳:云上跨可用区容灾和异地多活最佳实践
2022 年 7 月 4 日,【可观测,才可靠——云上自动化运维 CloudOps 系列沙龙_第一弹】正式推出,连续四天,四大主题分享,最后一位分享的讲师是阿里云弹性计算技术专家邓青琳,他带来的主题分享是《云上跨可用区容灾和异地多活》,以下是他的演讲内容整理,供大家阅览: 01 系统容灾容灾与备份区别、灾备技术、容灾体系规划
1.容灾备份的区别 容灾 (Disaster Tolerance):就是在上述的灾难发生时,在保证生产系统的数据尽量少丢失的情况下,保持生存系统的业务不间断地运行。 容错 (Fault Tolerance):指在计算机系统的软件、硬件发生故障时,保证计算机系统中仍能工作的能力。 区别 :容错可以通过硬件冗余、错误检查和五、redis哨兵两套环境同一局域网容灾切换问题
上周遇到个灵异事件,实验室有两套环境来搭建redis集群和哨兵,分别是: 第一套环境IP:67(master) 65(salve) 66(salve)第二套环境IP:115(master) 116(salve) 117(salve) 第一天把哨兵搭建好后,两套环境的主从关系都是一主两从,但是到了第二天,莫名其妙的,第二天环境的3个redis都挂载到第一套ACK One 构建应用系统的两地三中心容灾方案
作者:宇汇,壮怀,先河 概述 两地三中心是指在两个城市部署三个业务处理中心,即:生产中心、同城容灾中心、异地容灾中心。在一个城市部署 2 套环境形成同城双中心,同时处理业务并通过高速链路实现数据同步,可切换运行。在另一城市部署1套环境做异地灾备中心,做数据备份,当双中心同时故障时,异eReplication详解
eReplication简介 eReplication是一款基于华为存储复制、快照、双活、克隆以及FusionSphere主机复制等特性,保证上层应用数据一致性,针对华为典型容灾解决方案,提供可视化、流程化、简单、快捷的操作与监控平台的灾备管理软件。 本地保护 本地高可用 主备容灾 双活数据中心 两地三中删库到跑路?还得看这篇Redis数据库持久化与企业容灾备份恢复实战指南
本章目录 0x00 数据持久化 1.RDB 方式 2.AOF 方式 如何抉择 RDB OR AOF? 0x01 备份容灾 一、备份 1.手动备份redis数据库 2.迁移Redis指定db-数据库 3.Redis集群数据备份与迁移 二、恢复 1.系统Redis用户被删除后配置数据恢复流程 2.Kubernetes中单实例异常数据迁移恢复实践企业为什么要做应用多活?
简介:无容灾不上云,应用系统要随时具备对灾难故障的逃逸能力。平稳迁移上云是每位决策者的关键决策点。业务持续发展,架构不断演进,容灾治理解决的是发展中问题。如何实现应用多活的容灾架构和组织协同,也越来越成为更多企业者关心的问题。 容灾成为企业上云和用云的基础要求 2019 年 I7*24 小时业务不中断!菜鸟乡村应用多活落地实践
作者:比扬 从前期调研、方案评估、多活建设到最终核心物流业务的改造上线,仅仅只用了 2 个多月,菜鸟乡村就完成了核心业务同城多活容灾的目标,实现业务的 7*24 小时不间断服务,最大程度保障了业务稳定性及连续性。 菜鸟乡村作为服务农村的新型物流业务,通过数字化技术,打造县域、乡镇、村微服务架构 | 5. 服务容灾
@目录前言1. 服务容灾基础知识1.1 由一个服务资源耗尽引发的连锁反应1.2 服务雪崩效应1.3 四种客户端弹性模式1.4 服务容灾的几种解决方案1.5 服务降级的参考指标1.6 服务限流的作用1.7 常见的几种限流算法1.7.1 计数器算法1.7.2 滑动窗口算法1.7.3 令牌桶算法1.7.4 漏桶限流算法1混合云应用双活容灾最佳实践
简介:本文会通过一个业务 Demo 案例,介绍混合云容灾建设的难点,以及如何基于 MSHA 来快速搭建应用双活架构并具备分钟级业务恢复能力。 作者:远跖 前言 越来越多的企业在数字化转型和上云进程中选择混合云的形态(云+自建 IDC 或云+其他厂商云)来进行容灾建设,一方面不会过度依赖单一云阿里云开源业内首个应用多活项目 AppActive,与社区共建云原生容灾标准
作者:中西(github @zhongxig),AppActive 负责人,来自阿里云云原生高可用架构团队,从事容灾架构和故障快恢的研发和开源工作。 摘要: 继高可用架构团队的 Sentinel、Chaosblade 开源后,第三个重磅高可用产品:应用多活 AppActive 正式开源,形成高可用的三架马车,帮助企业构建稳定可靠的企业级回顾2021:如何帮助客户扫清上云最后一公里的障碍?
回望2021年,万博智云与合作伙伴一同快速发展,砥砺前行,不断助力客户解决在向混合云架构转型过程中的数据流转问题。新的一年,万博智云将持续在容灾和迁移的产品技术和解决方案上帮助合作伙伴,实现其高效上云、保障云端业务的目标,倾力打造互惠共赢的合作伙伴生态体系。在帮助不同领域混合云应用双活容灾最佳实践
作者:远跖 前言 越来越多的企业在数字化转型和上云进程中选择混合云的形态(云+自建 IDC 或云+其他厂商云)来进行容灾建设,一方面不会过度依赖单一云厂商,另一方面还能充分利用已有的线下 IDC 资源。 MSHA 云原生多活容灾解决方案 [1] ,也发布了混合云多活容灾产品能力。本文会通过一个业从0到1:美团端侧CDN容灾解决方案
CDN已经成为互联网重要的基建之一,越来越多的网络服务离不开CDN,它的稳定性也直接影响到业务的可用性。CDN的容灾一直由美团的SRE团队在负责,在端侧鲜有方案和实践。 本文结合美团外卖业务中的具体实践,介绍了一种在端侧感知CDN可用性状况并进行自动容灾切换的方案,通过该方案可有效IaaS首席架构师的架构设计思考与实践
摘要:本文分享了华为云Stack IaaS的设计思考与实践,基于公有云先进的架构技术和创新能力,采用重构改造+积木式搭配+抽屉式替换等方式,健康的、可持续的为客户不断的提供产品和服务。 本文分享自华为云社区《【华为云Stack】【大架光临】第4期:IaaS首席架构师的架构设计思考与实践》,作者云容灾实践 HyperBDR为大型物流服务企业提供本地容灾至华为公有云解决方案
项目概述 某大型集团是国有大型航空运输服务保障公司,集团主要油品采购、运输、储存、检测、销售、其业务布局横跨海内外。集团在IT业务基础设施上投入了大量的精力保障跨国业务的的可持续性发展、稳定性和可靠性。 为了取得高于平均水平的高可用性和应用保护,集团需要更高效linux下实现mysql数据库的主从配置、容灾备份、数据恢复和安全基线检查
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 实验准备1.实验环境2.下载安装MySQL 一、数据库主从配置1.概念2.配置内容 二、数据库备份三、数据库恢复四、数据库安全策略设置1.修改root用户的密码2.开启General Log: 五、数据库安全审计1.配置日容灾与备份区别、灾备技术和容灾体系规划
转至:https://blog.csdn.net/j6UL6lQ4vA97XlM/article/details/104911954 容灾 (Disaster Tolerance):就是在上述的灾难发生时,在保证生产系统的数据尽量少丢失的情况下,保持生存系统的业务不间断地运行。 容错 (Fault Tolerance):指在计算机系统的软件、硬件发生故障时,保证计算机系统中仍云栖发布|企业级互联网架构全新升级 ,助力数字创新
作者|白玙 在 2021 杭州·云栖大会现场,阿里云智能云原生应用平台产品负责人李国强以《企业互联网架构转型之道 - 阿里云中间件升级发布》为主题,全面解读阿里云云原生产品创新实践。过去一年中,为应对愈发激烈的行业竞争,重构应用架构已成为大势所趋,据权威机构数据显示,80% 以上的用户云栖大会第二天:ACK Anywhere 来了
今天,在 2021 杭州·云栖大会的现场,阿里巴巴合伙人、阿里云智能基础产品事业部负责人蒋江伟以“永不止步的云上创新”为主题,从自研、开放、安全三个角度解读阿里云基础产品的创新实践,并正式发布阿里云新一代飞天操作系统虚拟化技术:第四代神龙架构。 除了发布第四代神龙架构之外,蒋认识数据中心两个关键指标RTO和RPO
RTO和RPO是Business Continuity(BC) and Disaster Recovery(DR)里面两个重要的概念, 也是类似产品的Service Level Agreement (SLA)的两个重要的衡量指标。Recovery Point Objective (RPO),指的是最多可能丢失的数据的时长。Recovery Time Objective (RTO) ,指的是从灾难发生到整个系运维职责的定义
应用运维团队的职责: 对标一线互联网企业的运维团队 懂业务&懂技术架构,是某个业务系统的技术与架构专家 负责业务系统的部署与变更 负责业务系统的异常发现与故障诊断,确保服务连续性 负责业务系统的高可用架构设计与实现 负责业务系统的性能分析与容量规划 初级: 部署 根据单华为云计算IE面试笔记-请描述华为容灾解决方案全景图,并解释双活数据中心需要从哪些角度着手考虑双活设计
容灾全景图: 按照距离划分:分为本地容灾 同城容灾 异地容灾 本地容灾包括本地高可用和本地主备。(本数据中心的两机房、机柜) 本地高可用这个方案为了保持业务的连续性,从两个层面来考虑: ①一个是从主机、服务器这个层面考虑,假如这个服务器上的虚拟机或者业务挂了,可以自动的从其他