其他分享
首页 > 其他分享> > 数据分析师的个人修养

数据分析师的个人修养

作者:互联网

数据分析师的个人修养

前言

文章目录

第一部分

1. 岗位情况

1.1 国企

对比JD,我分析我自己,分析公司目前处于的状态,以及日常需要做什么

1.1.1 工作模块

  1. 日报每天必须要看,通过日报了解业务现状,培养数据敏感性;

  2. 周报一般用于ppt,因为是短期趋势;

  3. 月报用于评估目标及战略决策;

  4. 管理层需要了解背景,提交数据需要一再核对;

  5. 业务人员需要在处理需求是要思考,怎么样闭环,一定要多沟通。

    坚决不做提数机器

    • 针对每一个业务单点问题,先追根溯源,简历该业务类的分析框架,由点到面,彻底解决该类问题;同时,在这个过程中,要不断的利用互惠原理和社交技巧,只给业务方做最核心的需求,其他的延申需求让业务自己动手去完成。

    • 学会自动化发日报,不要自己做工具人;目标建立,即使在杂事中仍然能够保持清醒;必要时要寻求领导帮助,不轻易给自己挖坑填坑。

1.1.2 专题分析

  1. 需求解读

    • 至少花20%的时间分配在沟通上,一定要当面沟通。原始需求->了解需求->本质需求
  2. 建立逻辑树

    • 逻辑树的目的就是让思路更加简单清晰
  3. SQL提数及分析

    • 提数:SQL三段论,SELECT,FROM,W,ERE

    • 分析:组成部分,数量比较,有何变化,各项分布,各项相关性,其他深层次挖掘

  4. 撰写报告

    • 90%图10%文,图为主,图表标题说结论:

    联想电脑

    典型的图表标题说结论

    • 结论前置:漏斗结构
    • 讲故事:报告的逻辑性一定要强

1.1.3 软技能和面试技巧

四大能力

面试

面试

1.2 BAT

同样还是分析岗位JD,透过现象看到本质,了解岗位真正需求

1.2.1 日常主要工作

数据异常排查:

数据异常是每个分析师最常见的工作之一,大部分人都缺乏方法论,排查起来没有方向感和层次感,这里看看,那里看看,非常耽误时间,可能最后也没结果。所以,我们要有一套标准化流程去做这件事 ,只有这样,才能成为这块的专家。

数据波动大的原因无非是数据有问题或者业务有问题。

前期准备
方法论

1.2.2 专题分析

1.2.3 面试技巧

最重要的是前三面:

1.3 中小企业

1.3.1 三个问题解答

1.3.2 工作角色:斜杠青年

横向上:埋点、口径、指标体系、报表统计、数据清洗、平台研发、专题报告、数据培训

纵向上:对接产品、运营、市场、财务、销售

说白了就是SQL BOY背锅侠

1.3.3 转型:为了让自己及家人更好的生活

作为一名职业打工人,当前的工作要符合下两者之一才能证明挺好

  1. 当前薪酬不错,在行业中处于前列
  2. 当前岗位能学到很多有效知识,在你想的到的时间内能快速变现看得见、摸得着,能得到,才最真实
转型分析
1. 规划好自己,再评估和准备

数据分析师这个职位未来有三条线

2. 评估自己

这里以业务线为例,这条路线的考量标准有:

3. 优化自己

补短板,最重要的是深入而不是略懂,只有深入才能能自己的洞见

方法论:能快速从一个较全面、逻辑性、价值性的角度去分析,而不是单点无架构性分析,所有方法论都是通过不
断提炼、总结、实践得出来的。这个是评估一个分析师水平的重要标准

在这里插入图片描述

4. 寻找对象并实践

2. 数据分析工具

2.1 数据分析整体流程

背景:数据分析也是有一套标准化流程的 ,无论是新人还是老司机遇到一个问题时,都要从这一套流程出发去解决问题,而不是直接提数解决战斗

在这里插入图片描述

工具说明

工具应用场景掌握程度
MySQL、Hive基本上所有的数据获取方式
可以进一步学习一些Linux命令
超级熟练
数据提取不能出错
Excel最高频、最有机会展示的数据处理工具超级熟练
R统计语言,就是为数据分析而生,简单易学,但是计算能力较差,可能稍微大点的数据导入就死机了熟练
Python脚本工具,可扩展性极强,算法研发同学必备,数据分析以pandas包为主,其他包含爬虫,文本挖掘熟练

2.2 EXCEL常用操作

2.2.1 对比分析

对比分析:所有的数据只有对比才有意义,每年的双11都会与之前的双11进行消费额对比;实际工作中,最常见的对比对象就是大盘,比如新上线一个功能 ,怎么样评估这功能效果,除了看功能使用人数,更加要做的是这个功能的留存和大盘的留存对比。

2.2.2 时间序列拆解分析

时间序列二次拆解分析:一般看某指标时,都会把时序周期拉长,看数据趋势,而数据都是波动的,所以都会进行拆解分析,寻找具体波动项

2.2.3 相关性分析

相关性分析:在做某个子产品的时候,都会被问到你这个子产品对大盘的贡献度或者说影响度,这个时候就可以用相关性去说话

2.2.4 临界点分析

临界点分析:对于任何一款产品,高活跃用户与低活跃用户在产品使用上必然不同,那么就可能存在,某个指标,一旦用户在这个指标上的消费超过某个临界值时,后面用会变得非常粘性,这就是Magic number

2.3 SQL常见问题

不是会,而是要闭着眼睛都能写

2.3.1 如何训练SQL

常见现象: 一旦表关联较多,内部逻辑稍微复杂,就怀疑自己的代码准确性系

解决方案:

2.3.2 SQL常见问题

2.4 R语言、Python脚本案例

2.4.1 R语言机器学习

常见问题:对于一个产品的重要指标如留存,影响的因素非常多, 那么就需要找出这些影响因素的重要性,从而知道围绕哪些因素运营更好提升留存

SQL和excel明显都解决不了

换种方式理解上面这段话:哪些指标最能够区分用户留存还是未留存,越是阴显区分,越重要

转化为机器学习语言: 对于一个用户,他有一个y (留存/未留存),还有很多x(各种影响因素),需要找出x与y的关系,并给出x的重要度排序,可以用随机森林,逻辑回归,决策树来实现

2.4.2 Python相比R的其他价值

总结

第二部分

3. 数据分析多元思维模型

3.1 背景

整个行业中,大部分同学偏数据库和机器学习,造成一种错觉:

只要会点技术,再能做个PPT ,就可以做数据分析了,门槛太低,部分同学做了几年数据分析,觉得就到瓶颈了,同时很难去界定一个分析师是否优秀 ,觉得大家可能都差不多

真实情况是:

你做出的分析别人能很快的发现问题,你也认可,但就是不知道如何避免,针对某个问题,有些人总是能有很多想法,你也不知道怎么理解,有些人职业发展的很顺利,有些人始终在瓶颈

3.2 中观能力

中观能力:专业度,包括技术理解,逻辑性,价值点三个点

中观能力是反映分析师基本功怎么样、套路熟不熟练、思考到不到位的一种标准

技术理解:对分析需要用到的技术是否理解到位,是停留在理论阶段还是实践阶段

一定要理解这个只是理论上的方法,只有理解到数据标准化的本质目的是去除量纲量级的差异性,才能用好这个方法

技术是为了让业务更加方便高效,而不是让人困惑

逻辑性:整体思考的逻辑性是否欠缺。

每一环节的推导必须要讲究严谨性

价值点:做出来的东西价值在哪,如果现在你是决策者,你敢不敢立马规划落地。

有没有价值不是分析师说了算,是业务方说了算,有些点很好但暂时无法落地,就先不要管他

中观能力的提升相对比较容易,基本上就是从他人那里获得有效反馈,然后多实践就行

3.3 微观能力

3.3.1 微观能力理解

微观能力:包括有效沟通能力和快速发散收敛能力

微观能力是反映分析师平时的微观体感怎么样,作为一名分析师,你必须要能够发现到很多业务方发现不到的点,然后从数据上给出策略建议

前提:先知道业务是怎么想的,怎么做的,然后从中发现问题或者切入点,解决问题,这样就能高于业务

有效沟通能力:与业务方核心人员沟通,从谈话中快速捕捉到很多有用信息(说者无心听者有意)

快速发散收敛能力:基于沟通中的有效信息,快速提炼总结找到最好的分析切入点

所谓的好奇心或者说想象力,实都不是凭空产生的,回归到数据分析本质,只有和相关业务方(不一定是直接接触业务方)多沟通,从他们那里获得有效信息,再自身提炼加工(多学习、思考) ,才是可落地的天马行空,这个也就是优秀分析师厉害的地方(快速捕捉,提炼,找到问题,解决问题)

3.3.1.1 有效沟通能力的两个技巧
3.3.1.2 快速发散收敛能力

**发散:**对于某一个全新业务问题,跟业务沟通之后,分析师想法很多

**收敛:**在众多想法中,快速找到当前做哪个比较实际、合理,并且知道如何做的深入

3.3.1.3 微观能力的培养

3.4 宏观能力

宏观能力:能够把当前业务与实际社会热点、行业风口联系起来,提前预判,获得更好的决策

宏观能力非常难,如果做好了基本就是顶级CEO了,大部分同学都没有机会接触到这一层面(需要你有一定的决策权)

宏观能力案例:

在这里插入图片描述

3.5 总结:

案例部分

4. 电商数据分析——以京东APP为例

4.1 如何去看京东APP

4.1.1 用户视角

在这里插入图片描述

4.1.2 分析师视角

作为一名数据分析师,应该要能更深入,并且有层次性的去看这个APP的数据

有三个问题需要大家思考:

4.2 首页的分发效率

4.2.1 分发效率评估

除了要关注日活、留存、渗透率这些常规指标外,更加重要的是找到一些能够反映产品问题的指标

4.2.2 分发效率总结

基于日活、留存、渗透、分发效率,基本上就能够对APP的整体数据有个大概了解

作为一名优秀的分析师,除了要把自负责的产品做好外,更加重要的是不要设定边界,主动去了解整体数据,在这个过程中,你需要找到负责的产品跟大盘的数据关系

4.3 绕不过的漏斗分析

4.3.1 背景

了解完整体数据后,肯定要看具体细分数据,虽然整个APP坑位很多,但一切都是围绕交易额这个目标,而电商交易额的本质是转化率,所以任何一个坑位都绕不开漏斗模型

在所有的坑位中,搜索是最大的一个流量入口,因此以搜索为例,作为一名分析师,一定要多体验产品 ,找到新认知,这也是微观能力

4.3.2 了解每层漏斗的影响因素

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.3.3 漏斗模型总结:

应该说电商的大部分数据分析都会跟漏斗有关,除了经验之外,更加重要的是对产品本身的多体验,以及对竞品的学习, 保持好奇心和敬畏心

也只有这样,才能慢慢关注到其他同学关注不到的点,而这些是培养良好微观体感的重要一步

4.4 新用户分析

4.4.1 背景

作为一款非常成熟,在一线城市有很多忠实用户的APP ,当前在用户体量上与手淘相差仍然较大,因此我们会看到京东与各方APP战略性合作,共同拉新。拉新必然就要衡量拉新效果和拉新优化,拉新效果内部数据不太清楚,但是作为一名分析师,可以去看整个APP在拉新上可以优化的点。实际上拉新如果做的好,比老用户分析更容易出成绩

新用户产品体验:

在这里插入图片描述

4.4.2 新用户优惠券策略思考

4.4.3 新用户分析建议

新用户与老用户相比,由于对APP不熟悉,因此在漏斗环节,可能会有几个特征:

4.5 总结

5. 互联网金融toC授信模型——以芝麻信用为例

5.1 背景介绍

5.1.1 互联网金融行业数据分析师的角色

互联网金融的本质是风控,数据分析师在这个行业基本上有两种角色:

5.1.2 数据建模师到底干什么活

关键词:数据源、信用评分卡模型、模型上线监控维护、其他数据挖掘

5.2 授信模型

5.2.1 芝麻信用分结构

在这里插入图片描述

5.2.2 数据源的数据变量为何那么多

5.2.3 数据处理

实际上,所有的数据处理、数据建模都是为业务服务, 真实工作中,数据处理和数据建模都是慢慢迭代优化的,所以数据处理在前期不会搞的很复杂,一般就3种:

5.2.4 数据标准化

所有的变量都已经数值化了, 但是在量级和量刚上相差很大,如交易额和交易次数,这就没有可比性,所以要对所有的字段进行标准化,标准化的方法很多,选择合适的都行,这块对后面的模型效果没有影响。无论你是MAX-MIN还是Z-score

数据标准化之后(假设就是max-min) , 所有的变量取值区间都在[0,1]范围内了,这个时候就可以数据建模了

5.2.5 数据建模前思考

根据用户的数据,算出用户违约的概率,而这个概率也可以转化为用户的分数,所以逻辑回归模型就自然而然用上了

在这里插入图片描述
在这里插入图片描述

5.2.6 模型离线效果指标

离线模型中,混淆矩阵和ROC这两个指标就够了,因为真实工作中,最重要的还是坏账率这个评估指标。

5.2.7 模型运行周期

在产品初期,因为模型的变量太多,所以模型的迭代速度都非常快,基本上每个月都要跑一次分数,这个时候可能会出现某个用户的分数奇高,这些都是正常的,而这些都需要不断的调整权重和系数,慢慢优化才行,不过最重要的还是落地效果,就是用了这个模型之后坏账率怎么样,这就是模型落地了

5.3 模型落地

5.3.1 落地前

有了这样一套模型之后,你要出去找落地场景,我们看到芝麻信用围绕吃喝玩乐进行各种产品服务。

举例:

如根据芝麻信用分就可以申请招联金融信用额度,那么这就涉及到两个公司的产品合作了。金融行业的合作都是非常小心的,所以在正式合作前:

5.3.2 落地中

正式落地时,招联在给每个用户评估信用时,实际上芝麻信用分只是一个参考维度而已,一般都是这样:

5.3.3 落地后

前期一般是每一周 ,招联金融都会和芝麻这边对一次坏账情况,只有到这个时候,模型的参数调整才是最有意义的,这个时候也是最考验数据建模师的时候。调参方法:

5.4 总结

6.游戏数据分析——以欢乐斗地主为例

6.1 背景

电商——非常互联网

互联网金融——直接就是跟钱打交道

游戏——互联网思维+钱都要具备

游戏行业用户两极分化比较严重:要么快速流失,要么就玩的时间很长

所以本案例重点围绕两个目标:

坑位:

在这里插入图片描述

6.2 指标口径

6.2.1 重要指标业务理解——常规指标

6.2.2 重要指标业务理解——商业化指标

6.3 用户流失分析

6.3.1 流失定义

行业内一般对流失用户的定义都是:一个月内不使用产品即定义为流失

实际上,不同的产品形态用户行为差异非常大,像住宿类APP那就是低频高价值用户,欢乐斗地主7天不上线可能就已经流失,所以要合理的定义流失用户,对于流失用户,发现的越早越好

不能很好的定义流失就是因为用户有可能回流,比如拍脑袋30天,结果30天的时候,大量用户回流

所以实际上流失周期确定=回流率稳定,一但这个指标稳定 ,就定义这个时间段天数为用户流失周期

回流率=回流用户数/流失用户数=某个周期内的流失用户数在周期结束后又回来了/某个周期内的流失用户数

所以,只要按照枚举法,周期=1,2…30,然后分别计算回流率,一旦回流率趋于收敛 ,该周期就是流失周期

假设欢乐斗地主流失数据是这样:

在这里插入图片描述

6.3.2 欢乐斗地主流失分析

对于游戏行业的用户流失分析,即有其他行业的类似套路但又有一-些差异化很大的点

在这里插入图片描述

在这里插入图片描述

6.4 付费分析

6.4.1 背景

游戏这个行业前期投入大,本身迭代快,所以对付费变现有非常高的要求

在付费分析上,整体思路是:

6.4.2 欢乐斗地主付费分布

在这里插入图片描述

6.4.3 付费分析

很奇怪为何没有5元的付费金额?

无论是信息还是坑位都出现较大问题,只能说产品功能没有体验到位

在这里插入图片描述

6.4.4 用户群针对性建议

6.5 总结

游戏行业非常注重收入,分析师要每天看收入数据,所做的各种分析都要和收入挂钩。除了互联网那些分析方法,游戏行业更加注重分析师的深度体验,单纯的数据只能解决交互式的失误,而不能让游戏变得更好玩,所以分析师最大的价值是让用户玩的更爽,只有到这一步,才能实现真正的增长

7. 传统销售行业数据分析案例讲解

7.1 背景

针对一个陌生行业的数据分析需求,给如何去入手

(本节案例不好总结,因此完成度比较低)

7.1.1 需求解读

原始需求往往都是模糊的,但是:分析师不要带着不好的态度去推脱业务的需求,而应该跟业务良好沟通,有些业务方就是表达能力不太好

销售行业的核心指标是销售额完成率:按照正常业务理解进行维度拆解

在这里插入图片描述

7.2 提炼:如何去分析一个陌生行业

在这里插入图片描述

感到无从下手是因为:

案例部分总结

宏观思维模块

微观模块部分

8. 指标体系的那些事儿

8.1 指标体系的定义和选取原则

8.1.1 背景

对于某核心数据如日活,只知道数据在变化,但是不知道为何变化。产品为了解释这种现象一会儿要这个数,一会儿要那个数

年底汇报时,产品跟数据要各种各样的数据,或者数据内部花费大量时间对各种各样的口径

每隔一段时间,产品都会拉上数据研发一起对埋点,总是觉得当前的字段不够用,底层日志越来越大,数仓要修改的越来越多,取数越来越慢,错误越来越多

8.1.2 原因解释

根本原因在于缺少指标体系的建设、宣贯、实施

业务方不重视是因为这个活是个基建活,离KPI完成太远,只有出问题时才会临时重视,数据方没重视是因为这个活是一个吃力不讨好的活,可能认为就是一一个思维导图而已

然而真实答案是:要想把指标体系真正说明白不容易,而如果你都说不明白,你怎么判断你自己真的很懂呢,作为埋点、取数、分析的一切前提,这个活如果做不好,会始终发现很乱

8.1.3 定义和选取原则

8.2 指标体系的四步法

8.2.1 指标的构成

8.2.2 四步法

8.3 知乎APP指标体系实操

8.3.1 当前业务发展阶段

知乎当前处于业务发展期和成熟期之间, 2个论点

8.3.2 核心指标及拆解

在这里插入图片描述

有些同学可能觉得评论点赞收藏数应该是核心指标,实际上是这样:

8.3.3 会议、存档、建表

**会议:**产品(负责使用)、研发(负责打点)

**存档:**对不太好理解的指标要进行单独的解释,比如什么是日活

**建表:**确定好打点之后,就要建表,确保数据第一时间出来,能及时发现问题

在这里插入图片描述

根本不需要一套大而全的指标体系,只需要围绕当前的核心指标,解决最重要的问题即可

8.4 总结

第三部分

9. 流量分析

9.1 背景介绍

有了指标体系和报表之后,最重要的事情就是每天看各种数据了,这也就是流量分析

流量分析的定义:这里流量是广义的流量,从哪来,经过什么,产生什么价值,如果他波动了,为何波动

9.2 渠道分析

9.2 1 常见渠道及渠道分类

对于一款健康的APP,前期靠渠道特别是外部渠道的品牌带量,后期靠自传播或者免费推广

一般都会单独有渠道运营经理,其实分析师在这块价值不会很大

在这里插入图片描述

9.2.2 渠道的整个过程

在这里插入图片描述

9.2.3 渠道的关键指标

9.3 转化及价值分析

9.3.1 漏斗分析

见4.3

9.3.2 功能模块价值分析

常规分析包括:

价值分析包括:

总结:

9.4 波动分析

在这里插入图片描述

常见的流量波动分析就是两个:日活和留存,所以就围绕这两个来展开

9.4.1 日活

9.4.2 留存

9.5 总结

10. 路径分析

10.1 路径分析定义

10.1.1 背景

漏斗模型是非常经典的一种分析方法,但所有的漏斗都是人为假设的,也就是事前假设一条关键路径,事后看数据。

随着各类APP的功能模块,坑位越来越多,用户的行为越来越分散化,这个时候就要在用户的所有操作行为中, 发现一些产品设计初可能不知道、但非常有意思的用户前后行为,这就是路径分析

10.2 路径分析案例——以美团APP为例

在这里插入图片描述

10.2.1 日志

日志:用户在APP内所有的行为都是以表或者文件存储的,记录了用户最详细的行为信息

路径分析是基于时间序列的用户前后行为关联分析,所以都是基于底层日志来做

在这里插入图片描述

10.2.2 路径分析步骤

在这里插入图片描述

筛选

在这里插入图片描述

数据进一步关联及标准化——美食

在这里插入图片描述

数据进一步关联及标准化——附近

在这里插入图片描述

数据进一步关联及标准化——订单

在这里插入图片描述

路径分析是一件非常消耗体力的活,当前市场的大多APP恨不得把所有功能都塞进去,这就需要分析师对业务非常熟悉,分析师每天都要去体验自己的产品

每个产品经理都是负责自己的一小块功能,而分析师就是最大的产品经理,站在全局的角度去看产品,提出某个落地项,既能优化当前功能,又能对其他功能没影响,同时还能提升大盘数据,这非常考验综合思考力

10.3 路径分析思考

11. 竞品分析

11.1 为何要做竞品分析

11.1.1 背景

前面介绍的分析方法都是针对自身APP的,假设:

在这里插入图片描述

11.1.2 工作中竞品分析的场景

11.1.3 什么是竞品分析

竞品分析绝不是大而全的把竞品的功能罗列一遍,这个是最初级的产品体验分析

同时也不是日常的竞品数据监控,配置一张报表就完成

竞品分析包含两个点:

第二点最关键,到底你的leader想干什么,如果这件事他自己也说不清楚,那最好先别投入大量时间去做,不是你做的对和不对,而是问题都没搞清楚,即使他是leader

11.2 竞品分析的步骤

11.2.1 分析的目的是什么

尝试进入某个新的行业,需要评估可行性——唯品会做唯品金融

这种分析更加偏行业趋势、市场规模,财务收入,看大数不拘于小节。在第五章节行业分析会提到

纯粹看竞品的功能、玩法和数据,学习优点,人无我有,人有我优——学习为主

以功能体验、运营手法、具体数据为主,最常见,落地性非常强,后面举例也是这块

通过看竞品的不同版本迭代的功能、玩法和数据,揣摩竞品想干啥——预防为主

看竞品的版本迭代,思考竞品最近的战略中心在哪,往往是为了满足管理层的需要

11.2.2 挑选1-2家竞品,进行对比分析

挑选1-2家真正竞品:核心功能一-样

功能体验分析:不需要大而全

运营手法分析:某个功能的运营手法

宏观微观数据分析:数据源很关键(基础数据、财务数据、市场数据)

分析师牵头、产品运营协助的一项团队任务,可能还需要财务、市场部的参与才能完成

实际上,有时候也要对双方的技术实现做一些对比分析,这个就很底层了

11.2.3 给出初步分析结论

尝试进入某个新的行业,需要评估可行性——是否可以进入,如何开始做, SWOT分析

纯粹看竞品的功能、玩法和数据,学习优点,人无我有,人有我优——竞品什么功能好,接下

来产品运营会如何去做,预计带来收益多少,产品运营参与很重

通过看竞品的不同版本迭代的功能、玩法和数据,揣摩竞品想干啥——竞品下一步战略是什么,我们要不要也做某种尝试,这种是最难的

11.3 案例介绍

竞品分析

12. 营销活动分析

12.1 当前现状

营销活动每年花这么多钱,因此必须要找一个公正的第三方一 数据分析师,来做这件事,而数据分析师既然要做,就一定要发挥出自己的专业性,都是罗列数字,为何你就是不一样,你的强大逻辑性在哪

营销活动的运营人员:活动带来XXX用户量增长,拉来XXX新增,外界传播量XXX

数据分析师:活动期间每天进行效果播报+活动后1~2周内报告产出

营销活动应该是一件长期的事务,不可能通过某一次活动就能够带来大量的用户增长,因此分析师在做这件事时,要保持:

12.2 怎么分析

在做任何活动之前,活动运营方必然要出文案,找开发,商合作,所有的这一切都会发生的很早,因此分析师要想真的做好这一块分析,在这个时候就要多与活动运营方沟通,知道大概是怎么回事

12.2.1 活动前准备

12.2.2 活动中

12.2.3 活动后

12.2.4 总结

在这里插入图片描述

第一次分析师帮助运营人员全部做好并形成模板,后续就让运营自己去弄,活动是个非常个性化的活,分析师不应该投入太多时间在这里面

12.3 案例分析——百度APP为例

在这里插入图片描述

12.3.1 指标体系搭建

找到关键指标,按照用户基础属性和行为属性进行拆解:关键指标是带来新增用户和活动参与用户

在这里插入图片描述

12.3.2 活动后复盘——绝不是简单的数字罗列

在这里插入图片描述

12.4 总结

13. 用户增长分析

13.1 用户增长模型理解

13.1.1 用户增长基本模型

在这里插入图片描述

如果是这样会好很多:

在这里插入图片描述

未来可能会这样:

在这里插入图片描述

最好是这样:

其实:分析师的任务就是做规模和带收入,一直没变, 一定要独立思考,不要被各种风带偏

13.2 国内的用户增长现状

13.2.1 看似很唬的几个用户增长方法

13.2.2 实际很好的2个增长思维

13.3 增长案例解析

摩拜滴滴

13.4 总结

第四部分

14. 找到本质问题和逻辑树拆解

偏技巧性,请移步此处

15. SQL提数和分析

15.1 前期准备

一般来说 ,在正式写SQL之前,要花1天时间去做以下几件事:

因为提数的最终目的就是为了分析,所以这两步是一起的,看似很简单,但是往往比较花时间:

15.2 集中时间和精力

首先要有这种意识:当前最重要的事情是SQL提数和分析

15.3 踩坑

在"坑”这件事上,踩坑是必然的,不过我们可以通过这件事来观人阅事:某个团队中,谁比较靠谱,谁比较好说话,谁尽量不要接触

遇到坑之后,一定要文档详细记下来,这样做的好处有二

15.3 如何分析

15.3.1 结构分析

在这里插入图片描述

15.3.2 对比分析

对比分析:所有的数据只有对比才有意义,每年的双11都会与之前的双11进行消费额对比;实际工作中,最常见的对比对象就是大盘,比如新上线一个功能 ,怎么样评估这功能效果,除了看功能使用人数,更加要做的是这个功能的留存和大盘的留存对比。

15.3.3 时间序列拆解分析

时间序列二次拆解分析:一般看某指标时,都会把时序周期拉长,看数据趋势,而数据都是波动的,所以都会进行拆解分析,寻找具体波动项

15.3.4 相关性分析

相关性分析:在做某个子产品的时候,都会被问到你这个子产品对大盘的贡献度或者说影响度,这个时候就可以用相关性去说话

15.3.5 临界点分析

临界点分析:对于任何一款产品,高活跃用户与低活跃用户在产品使用上必然不同,那么就可能存在,某个指标,一旦用户在这个指标上的消费超过某个临界值时,后面用会变得非常粘性,这就是Magic number

15.4 总结

实际上所有的分析都是基于用户的基础属性和行为属性。如果你还是不会,那就从5W1H出发, 每次分析的时候都以这个为模板来展开

16. 报告撰写

16.1 报告撰写原则

16.2 报告组成部分

标准化组成部分

所有的数据结论和落地项中,只要最后有1~2个真的应用了,这份专题报告就非常有含金量

16.3 报告案例

案例精选

16.4 总结

17. ABTest

17.1 AB测试介绍

17.1.1 概念

AB Test

关键词:组成成分相同的访客;同一时间;用户体验数据和业务数据

17.1.2 AB测试流程

17.1.3 常见的AB测试类型——UI界面型

在这里插入图片描述

17.1.4 常见的AB测试类型——算法策略型

在这里插入图片描述

17.1.5 实际工作中的问题

严格模式下,所有的专题报告落地项(除了明显的bug修复和明显的用户体验) , 都要靠ab测试展开,然而,分析师经常会遇到这种问题:

17.2 AB测试注意事项

17.3 AB测试案例

Netflix、墨迹天气

17.4 思考总结

第五部分 数据分析师个人修养提升

18. 行业分析

18.1 行业分析的两种背景

18.2 行业分析——问题的识别与拆解

在这里插入图片描述

围绕分析目标,把这5大模块说清楚,不在于大而全和什么方法,而在于有所发现

举例

19. 数据仓库

19.1 大数据体系:高度要够,熟悉整个行业,专注某个模块

在这里插入图片描述

19.2 数据研发工程师和数据分析师的关系

19.2.1 APP日志采集中的埋点

前中期:数据分析师进入一家公司时,一定要参与到埋点讨论中去,不要把研发想的多专业,如果埋点出问题了,会非常耽误业务的分析。很多研发就是纯粹凭感觉埋。在这个过程中把埋点规范建立起来。

后期:不要投入太多时间,知道有哪些新的埋点,文档化即可,后面所有的人都参照这个

包括规范化好公参:这个是分析师来定,就是有些参数是所有行为日志一定要有的,日志名、业务模块、具体功能

也就是说:一定是分析师牵头,树立自己的权威性,埋点是不是很繁琐,但非常重要,任何做分析的人都要找你,所以良好的发展需要这些软的东西

19.2.2 建模

痛点:

日志量太大,跑数很慢:一个简单的Join都要半个小时才能出结果,而sql仅是非常容易出错的

结果:整个分析团队产出效率太低

日志太乱,很多重要的数拿不出来:算近一个月新增用户的订单量,如果没有好的数据建模,根本就跑不出来

结果:很多重要的思考点都无法落地,显得很不专业

为何要建模:

19.2.3 主要步骤

在这里插入图片描述

注意:

19.2.4 数据管理

19.3 总结

20. 用户研究

20.1 什么是用户研究

用户研究是一种职业意识,任何人都应该具备用户研究思维,包括:

20.2 什么时候做用户研究

用户研究是贯穿整个项目生命周期的

20.3 用户研究的步骤和关键点

举个例子

20.4 用户研究和分析师的关系

数据分析师一定要有用户研究的意识,常见的做法是:

21. 时间管理

21.1 时间管理

21.2 关键点1——早起

早起的好处:

21.3 关键点2——阶段性熬夜

当最近的时间对你接下来的发展很重要时,这个时候就要投入大量时间去做这件事了,这就会造成相比于平时时间不够用,所以一定会有一个阶段性熬夜,熬夜的好处:

21.4 关键点3——上下班时间

一线城市上下班时间:90分钟

21.5 关键点4——会议时间

会议前要充分了解会议主题和参与人,跟自身没什么关系就不需要去

会议有3个目的:

21.6 关键点5——周六日

周六日要做到学习娱乐平衡

实际上,一旦你在周六日进行了学习,下周的工作会变得更加自信,状态会非常好

作为数据分析师,独自去研究一些专题 ,也只有周末时间能满足你

后记

这是我大三时期智慧调研数据分析班的第一周笔记,这几百分钟的课程来源于我前同事就职于的公司——拉勾教育的一位老师的分享,在这门课中,我解决了好多在公司实习时期的疑问。这个课,全是干货,在之前我的生涯规划中,一直认为技术是最重要的,在听了这位前辈的分享之后,我对我自己的想法进行了改观。在之前的实习中,我也对职业进行过一定的思考,但是还是比较迷茫。在听了前辈的分享后,我有了方向,在个人发展方向,有了目标,Spring老师算是我的启蒙老师了。

标签:分析,APP,分析师,用户,竞品,个人修养,数据
来源: https://blog.csdn.net/weixin_43644559/article/details/120311187