首页 > TAG信息列表 > sre

CISCO SRE实习生面试经历,我是如何拿到offer的。

CISCO SRE实习生面试经历,我是如何拿到offer的。 我是 Dipto Chakrabarty,是 VIT Vellore 计算机科学领域的一名研究生,专攻信息安全。我的主要兴趣在于 Devops、云计算和后端开发领域。我之前在 Devops 领域做过实习,也为开源做出了贡献。我被 CISCO India 选为站点可靠性实习生和全

活动预约|阿里云如何搭建云服务 SRE 与可观测体系

近几年随着 DevOps 发展,SRE(Site Reliability Engineering)开始被大家所熟知。随着国内互联网、金融、新零售等行业的飞速发展,SRE 也不再局限于互联网企业大促时的保障与平时的稳定性轮值,并凸显其独特价值:以软件工程的方法论重新定义研发运维,驱动并赋能业务演进。在保障业务高速发展

2.SRE与DevOps的关系

问题: 1.已知的那些所谓最佳实践方案都高度依赖于环境,无法进行广泛的应用。运维团队的工作该怎样良好的开展,也是一个尚未解决的大问题; 2.业界经常将运维视为一个成本中心,想要取得实质性的改变变的举步维艰; 3.上述原因推动了IT领域的工作改革,解决这些问题的最新方案有了两个独立的称

sre之监控报警---当我们监控报警的时候我们应该监控报警什么?

google有四个黄金信号,分别是 Latency — The time it takes to service a request   Traffic — A measure of how much demand is being placed on your system   Errors — The rate of requests that fail   Saturation — How “full” your service is.   但

SLA、SLO 和 SLI

SLA、SLI 和 SLO 是 SRE 工程实践里非常核心的概念,但是大家在同时提到这些概念的时候,经常容易混淆。 长篇大论的文章反而容易使人更加疑惑,还不如画一张示意图说明一下,帮助大家一次性彻底梳理清楚这些不可以含糊不清的核心概念。说明一下,下图假设所讨论的 SLA 个数为 1,使用了软件

SRE运维工程师笔记-Linux基础入门

SRE运维工程师笔记-Linux基础入门 1. Linux基础1.1 用户类型1.2 终端terminal1.2.1 终端类型1.2.2 查看当前的终端设备 1.3 交互式接口1.3.1 交互式接口类型1.3.2 什么是shell1.3.3 各种shell1.3.4 bash shell 1.4 设置主机名1.5 命令提示符 prompt1.6 执行命令1.6.1 执行

EF Core左连接内连接

内连接查两张表 from oo in query join comany in _companyRepository.GetAll() on oo.OfflineOrder.CompanyId equals comany.Id where comany.IsFamous select oo; Lamad内连接 _storeRepository.GetAllIncluding().Join(_storeSupplierExtRepository.GetAllIncluding(),

阿里数据库SRE

数据库稳定性治理 数据库是应用的核心命脉,对于ECS管控来说,所有的核心业务全部跑在RDS之上,如果数据库发生故障,对应用的损害无论从管控面或者数据面都是致命的。所以,SRE做的第一件事情就是守住核心命脉,对数据库稳定性进行全面的治理。 首先,我们先来看一下ECS管控在规模化业务下,数据

SRE 崩溃

B站崩溃后,技术总监淡定吃烧烤,网友们的评论乐死我了 https://mp.weixin.qq.com/s/zAQjduY-tHAqfob897oKSA     B站高可用用架构实践 2020-04-22阅读 166.7K0   本文被 50 个清单收录,推荐清单 流量洪峰下的高可用架构 流量洪峰下要做好高服务质量的架构是一件具备

马哥门徒N57-SRE第三周

redis服务配置文件详解 Redis默认不是以守护进程的方式运行,可以通过该配置项修改,使用yes启用守护进程 daemonize no 当Redis以守护进程方式运行时,Redis默认会把pid写入/var/run/redis.pid文件,可以通过pidfile指定 pidfile /var/run/redis.pid 指定Redis监听端口,默认端口为

什么?你竟然不知道SRE工程师!

今天,我们来简单聊聊关于SRE工程师的那些事 在正式开始之前,我先跟大家讲一下我的个人经历:今年春招找实习的时候,依稀记得那是一个日暖风和的中午,我坐在电脑前,而网线的另一端是和蔼可亲的面试官——是的,我正在进行一场某企业的技术面试,岗位则是SRE工程师 面试的前半段,我跟面试

Linux运维架构师、SRE技术图谱

Linux运维架构师、SRE技术图谱 Web服务器: apache, tomcat, nginx, lighttpd, varnish 监控: nagios、 ganglia、 cacti、 zabbix、 Prometheus 自动部署: ansible、salt、 puppet、 cobbler 配置管理: puppet、 cfengine、 ansible 负载均衡:lvs、 haproxy、 nginx 高可用: keepal

2019 SRE 调查报告:事故处理是主要工作,SRE 压力山大

2019 年 1 月,网站监测服务公司 Catchpoint 通过邮件列表和社交媒体进行了一项 SRE 调查。来自不同行业的 188 名 SRE 参与了这项调查,回答了如何管理事故以及事故后压力等一些问题。今年是 Catchpoint 连续第二年调查 SRE 这个新兴的职业角色。去年的调查专注于 SRE 是谁,主要做什么

Elastic-Job-Cloud作业云在当当的SRE实践

 高洪涛 分布式实验室本次分享面向对Mesos与SRE感兴趣的听众。随着容器技术在国内的持续流行,关注点已经由容器技术本身向运维方面逐渐过渡,Google一直安利的SRE经验正好契合了这个时代的运维节奏,由此契合SRE概念而衍生的Mesos,Kubernete服务也持续推动着相关理念落地。当当正是在这

DevOps适用于小团队吗?

 冯旭松 译 分布式实验室正如我最近在Twitter[1]上写的那样,我最近花了相当多的时间来思考“DevOps”的人员可扩展性。(将DevOps打上引号是因为它有各种不同的定义,在下面将会讲到。)我最终得出的结论是,虽然DevOps可以很好地适用于小型工程组织,但这种做法如果没有仔细考虑和管理的话

DevOps适用于小团队吗?

 冯旭松 译 分布式实验室正如我最近在Twitter[1]上写的那样,我最近花了相当多的时间来思考“DevOps”的人员可扩展性。(将DevOps打上引号是因为它有各种不同的定义,在下面将会讲到。)我最终得出的结论是,虽然DevOps可以很好地适用于小型工程组织,但这种做法如果没有仔细考虑和管理的话

云端的SRE发展与实践

本文根据作者在美团点评第21期技术沙龙的分享记录整理而成。背景SRE(Site Reliability Engineering)是Google于2003年提出的概念,将软件研发引入运维工作。现在渐渐已经成为各大互联网公司技术团队的标配。美团点评作为综合性多业务的互联网+生活服务平台,覆盖“吃住行游购娱”各个领域

我所理解的SRE、PE和应用运维 -- 赵成

我所理解的SRE、PE和应用运维 SRE这个概念我个人印象中应该14年下半年左右听到的,当时只知道是Google对运维岗位定义,巨牛逼的一个岗位,在网上查到SRE是叫网站稳定工程师,只要是保障稳定为主,其他就没有更深的意识了。15年开始逐渐有更多在Google工作或接触过这个岗位的专家在介绍这个

结束语|聊聊我的SRE落地心路历程

你好,我是赵成,不知不觉我们已经来到了结束语,非常感谢你的一路陪伴。 学完咱们的专栏,我想对于 SRE 到底是怎么一回事儿这个问题,你应该有一个大致的了解了。就像我们在开篇词中提到的,SRE 真的没有那么神秘,你平时在做的很多事情本身就属于 SRE 的范畴,学到这里,你应该对此深有体会了。

06 | 故障发现:如何建设On-Call机制?

在上一部分,我们学习了 SRE 的基础,需要掌握的重点是 SLI 和 SLO 以及 Error Budget(错误预算)策略。SLI 是我们选择的衡量系统稳定性的指标,SLO 是每个指标对应的目标,而我们又经常把 SLO 转化为错误预算,因为错误预算的形式更加直观。转化后,我们要做的稳定性提升和保障工作,其实就是想办

01|SRE迷思:无所不能的角色?还是运维的升级?

有人认为 SRE 就是一个岗位,而且是一个具备全栈能力的岗位, 只要有这么一个人,他就能解决所有稳定性问题。这还只是一种理解,而且这个理解多是站在管理者的角度。 SRE是指Site Reliability Engineer (网站可靠性工程师)。他是软件工程师和系统管理员的结合,一个SRE工程师基本上需要掌

Go在Google SRE的工程实践

原文地址:https://opensource.googleblog.com/2021/04/actuating-google-production-how-googles-sre-team-uses-go.html) 原文作者:Pierre Palatin 本文永久链接:https://github.com/gocn/translator/blob/master/2021/w15-actuating-google-production-how-googles-sre-team-uses-go

读SRE Google运维解密有感(一)

读SRE Google运维解密有感(一) 360addops团队 360云计算 作者有话说: 这几天打算利用碎片时间读了一下"SRE Google运维解密"这本书,目前读了前几章,感觉收获颇多,结合自己的工作经历和书中的要点,写一些感悟和思考,希望对大家有一点帮助。PS:丰富的一线技术、多元化的表现形式,尽在“HULK一

读SRE Google运维解密有感(一)

读SRE Google运维解密有感(一) 360addops团队 360云计算 作者有话说: 这几天打算利用碎片时间读了一下"SRE Google运维解密"这本书,目前读了前几章,感觉收获颇多,结合自己的工作经历和书中的要点,写一些感悟和思考,希望对大家有一点帮助。PS:丰富的一线技术、多元化的表现形式,尽在“HULK一

使用开源软件打造类似Google的开发和生产环境

作者简介:Minghua YeGoogle  SRE 主管2007加入 Google 公司,2009年开始,主要负责 Google 的云计算平台,特别是 Google App Engine。前言如果大家对 App Engine 还不熟悉的话,简单来说 App Engine 就是 Google 提供的 paas,一个开发、托管网络应用程序的平台,使用户的程序能在 Google 的数