原来学好数据分析,你还能搞热搜、判断哪里帅哥/美女多…
作者:互联网
在很多人眼里,数据分析类的工作是非常枯燥的。除了计算企业历年来的财务、业务数据,就是做各种竞争对手调查报告,再要么,就是提各种产品销售建议。
然鹅,你可能没发现,学好数据分析后,你还可以做点有意思的事情:
比如,计算春运时期怎样回家过年,经济又方便;
比如,分析如何让自己的爱豆上热搜;
再比如,判断全国在哪里偶遇帅哥/美女的概率更大……
如果你也想要解锁这些隐藏技能,那就请你接着往下看吧~
1)解锁「热搜」技能
如何证明一部剧很多?只要看看它有多少话题上热搜即可。那么,什么是热搜呢?
所谓的热搜,就是大家关注的最热最火的话题。而往往,一部剧的弹幕数量和弹幕内容,就决定了这部剧有多少话题能上热搜。那么,我们应该如何解锁【爬取弹幕】这项技能呢?
下面,我们就以前段时间非常火的电视剧【赘婿】为例,来扒一扒可爱的弹幕。
第一步:寻找URL,采集数据
由于整部剧共36集,所以我们需要先获取整部剧的URL。
通过这样的方式,获取全剧的URL。
第二步:请求数据
参照下方这段代码,
这样,就可以获取含有的弹幕信息的xml文件,并可以下载到本地了。你得到的信息是类似这样的文件:
第三步:合并数据到excel
利用下面的代码,完成相应操作:
注意,尽量不要使用XLWT来操作,容易算不下(容不下数万条弹幕君)。这样,我们就可以这样就可以将XML里的数据保存到Excel中了。
通过上面的这串代码,得到类似的Excel文件:
第四步:浏览数据
通过导入数据包,读取数据,重置数据,我们就能得到如下这样的数据表:
这样,你就能判断什么话题即将出现在热搜里了!是不是很简单?
2)解锁「求偶遇」技能
前两天刚更完的热剧《山河令》捧红了主演龚俊。
而在抖音短视频里,龚俊即兴哼唱的“爱你,芜湖~”捧火了芜湖。很多喜欢龚俊的追星女孩,还以为龚俊是芜湖人,纷纷留言表示要想芜湖“求偶遇”。
而她们不知道的是,其实,龚俊是成都人。(不知道哪些没有百度过,说走就走的追星女孩得知这一消息时,会不会失望?)
那么,作为追星女孩/男孩,我们究竟要去哪里,才会更容易偶遇帅哥/美女呢?这时候数据分析技能,就显得格外牛X了。因为,你可以通过搜索引擎,轻易的获取国内爱豆的微博超话信息。
(注:图片来自谷雨数据)
通过图片数据,我们能够轻易的知道:来自川渝籍贯的爱豆数量遥遥领先,占据了总数的15%。难怪不得经常听别人说,自古川渝出帅哥美女呀!
所以,在求偶遇这件事情上,我建议你提前解锁数据分析这项隐藏技能。
3)其他技能
事实上,会数据分析后,你还能解锁很多隐藏技能。
比如,通过自己回家的方式,休假时间,需要耗费的时间,票价,舒适度等综合因素,计算自己何时通过何种方式回家,获得一份方便快捷的出行方案;
再比如,你可以通过了商品的品类,全国消费某种产品的数量,国家政策等综合因素,帮助企业地新商品判断在各地的销售数量比重,盈利情况;
当然,你还可以通过数据分析,计算出“双十一”究竟怎么剁手更划算,等等。
写在最后
或许数据分析作为一种职业,在很大程度上,我们都会觉得它枯燥无聊。但是,如果我们运用数据分析技能,去做一些有意思的、接地气的分析,那么,你将会深深地被数据分析所吸引。
事实上,没有什么工作是真的很有趣的,有趣的是你如何将这些技能应用在有意思的事情上,让它接地气,让你愿意继续喜欢这个技能。
换句话说,有趣的工作世上无几,有趣的灵魂我中意你!!!
标签:数据分析,帅哥,数据,解锁,学好,弹幕,追星,技能 来源: https://blog.csdn.net/xuezhangmen/article/details/115517858