其他分享
首页 > 其他分享> > 2020 年终总结

2020 年终总结

作者:互联网

        不平凡 2020 终于过去了,回顾这一年,却也不知道写些什么。注册的个人公众号上一篇是 2019年1月1日,一年都没有更新了。2021 年一定要更新频繁些。附:《2019年终总结》

        2020 年的主要时间一方面花在日常的项目迭代中,另一方面花在框架的开发上。框架的开发主要是程序监控。以前由于没有监控,很多问题的排查只能靠猜,对于许多客户反馈的偶现问题,最后也就不了了之。没有监控,我们面临许许多多问题,主要表现在以下几个方面:

    当 “消防群” 里出现问题的时候,商户要么找服务端,要么找客户端,服务端和客户端也需要相互沟通,费时费力,对于有些问题,可能是客户端问题,这个时候仍然需要服务端配合。有时候对于特定用户才会出现的问题,我们还需要让商户给我们加员工,进行复现。排查问题链路如下图所示:

图片

 

    当客户反馈偶现问题的时候,我们排查问题就更加困难,偶现 bug 解决率很低。主要原因有:

  1. 对于偶现问题,代理商也不能提供更多的信息。
  2. 客户端、服务端排查问题后,发现导致这个偶现问题的可能性有很多种,无法定位到真正的原因。

举个例子,App 偶尔不打印问题:

图片

如上图所示,导致不打印的情况会有很多种,到底是哪个链路出问题,不好排查,如果是从阿里云下载打印文件出问题,就更难排查,因为自己的服务端感知不到。

 

  1.  用户的体验如何
  2.  程序的性能如何
  3.  接口的平均响应时间
  4.  接口响应大小

 

于是我们开发了一套 App 的监控框架。为什么不使用开源,一方面有些开源的年久失修,有的不符合要求。另一面自己开发便于定制特殊化需求。

第一个版本的监控主要提供了:链路监控、接口监控、基本的统计功能。

链路回放能力。如用户在某个时间的短内做了哪些操作,请求了哪些接口,成功情况等​,这样对我们排查问题起到很大的帮助:

图片

接口监控​:我们可以统计哪些接口耗时最长、​响应的数据最大(极端情况,有的用户的某个接口 30几万的行的JSON)、接口错误率等等。基于这些数据我们可以提前优化,不用等到用户频繁的爆出问题​再去优化。

页面曝光时间、页面PV:我们可以根据页面曝光时间和页面PV可以得知用户访问的页面最多,停留的时间最长。这样就知道哪些界面使用的最频繁,​哪些页面是可以弱化。

图片

常用的 统计功能:如App版本分布、系统版本分布、​用户网络状态部分等。

 

图片

监控是一个很大的话题,包括数据采集、存储、上报、分析等。第一个版本的监控,还有很多需要完善的地方。这个就要等到  2021 年了。

 

除了监控,还做了一些提高开发效率的小工具,例如使用 Python3 编写脚本来管理多仓库(https://github.com/chiclaim/Repos),Google Repo 还有挺麻烦,很多新来的同事经常忘记还是需要去管理 manifest,也不支持多个 remote。同时也制定了一些开发流程相关的文档。

 

就写到了,2021 加油 ~~~

 

 

标签:偶现,年终总结,接口,问题,排查,2020,监控,服务端
来源: https://blog.csdn.net/johnny901114/article/details/112147089