运维无小事,小事不运维
作者:互联网
运维分为两种,一种是运维服务,一种是系统运维,而里面又可以继续细分,但是总体上来说,一种是对外的,直接面对客户的,一种是对内的,可能是客户无感知的,例如中断1秒。
我们总是喜欢做自己擅长的事,对于不会的,除了望羊心叹,还能干啥?还能放弃咯。。。
风言风语
人与人之间靠什么保持连接呢?和检活报文一样的探测包?不是很懂,明天会是什么样呢?谁又会认识谁。。。
运维无小事,每一件小事都可能触发连锁故障,最后导致全部服务宕机。
心里没点X数吗?你连五毛钱都不值,还幻想和人探讨各种技术架构,各种数据结构,什么底层,什么操作系统,什么高可用高性能高扩展。。。懂基础理论的不一定是好的运维,但是不懂的一定是不好的。
没有好的颜值,就莫妄谈内涵。。。能动手的不要靠嘴说。。。
现在的人有一种通病,一件事不行,事事不行。。。一件事做错了,上升到人生***。就和下象棋一样,一步错,步步错,弯道超车谈何容易,需要承担更大的风险,需要付出2N+1倍的努力,还不一定会有收获。
每一个新手在走上运维之路的时候,碰到第一个问题或者故障的时候,都会紧张,都会心慌慌,大汗淋漓,手指发抖,为什么会出现这种情况?因为是第一次?
理论情况下,很多故障和问题都不会发生,但是在生产环境偏偏发生了,还找不到原因,是不是一脸懵逼。。。表面稳如泰山,内心慌如老狗。
在真实生产环境下操作和在自己电脑上练习还是有很大区别的,例如在自己电脑上停止一个容器,简单不,so easy,在生产上试试,如果碰到了单点故障呢?业务瘫痪。。。
慌是因为对环境不了解,不知道这个操作下去会对环境造成什么样的影响,但是可以换一种思路来想,这个服务本来就是坏的,我操作下去,最坏最坏的情况下依旧是这个服务不可用,但是再换一种思路来想,一不小心操作下去了,本来影响不大,造成了连锁故障呢?本来是一个小问题,一不小心。。。成了故障。
慌是因为对造成的后果是未知的,而这个未知的情况就很刺激了,没准明天就失业了,没准明天就升职加薪了,哈哈哈,刺激不刺激。。。
一个命令,如果你不知道造成的影响,那么谁为你背书?当你孤立无援的时候,你会找到谁来帮助你,那么再假设一种极端情况,如果你是单兵作战或孤立无援呢?
从入门到删库,从删库到跑路。。。
从理论到实战的拓展,这个是一个突破的过程,而且也是承担很多压力的过程,应该好好享受,找到合适的资源来进行背书,这样才能尽量的减少风险,在最关键的时候,你能找到谁来救你,谁能帮你,这个很关键。。。
人极度不可靠,所以很多风险规避机制都不是靠人,毕竟人要是可靠,母猪都能上树。。。
规避风险,可以使用构建更可靠的系统,开发配套的运维工具,不用命令进行操作,而实现白屏化的操作,只要点点界面的傻瓜式操作,妈妈再也不担心我的手残误操作了。。。
辅助系统很重要,所以总是要求运维会点编程语言,开发各种配套的监控脚本,开发各种批量操作脚本,毕竟。。。系统能扛住很多风险,系统的可靠性远远强于人,人会离职,而系统不会,系统一直在升级,体验也会越来越好。。。
很多开发说,运维太简单了,不就几个命令么,我也会。。。来试试,哈哈,开发虽然就是几个api,方法,rpc调用,而我依旧觉得很复杂。。。
运维压力负载,多扛扛就好了,看看到底能扛住多少压力,所谓的修罗试炼就是这么诞生的。
遇到压力,放开心态,去感受那种压力,去享受那种无与伦比的力量,把那种压力放大十倍看看,再放大一百倍试试。保持无状态,就像容器一样,实在扛不住,睡一觉或者重启一下试试。。。风吹了无痕
标签:无小事,运维,试试,系统,一种,故障,不运维,操作 来源: https://blog.51cto.com/15060545/2651662