某众点评爬虫采集-剧本杀市场分析-Python
作者:互联网
背景介绍
伴随着《明星大侦探》等推理综艺走红,剧本杀游戏也成功出圈,成为年轻消费者偏好的休闲娱乐活动之一。同时随着体验经济的发展,人们对剧本杀这种新消费业态接受度比较高,从而推动其在国内的快速发展。
数据采集:
这节主要是讲解如何爬取数据。
由于大众点评反爬非常非常非常非常非常严格,因此使用了cookie池、ip代理等诸多防ban手段。
某点评反爬策略是字体反爬,需要解析评论、销量等字体才能拿到数据,我们通过在页面信息中解析出字体css文件,对加密字体进行映射从而拿到数据。
数据展示:
数据分析:
采集了全国不同地区剧本杀商家,进行地图分布统计。
可以看到排名前十的商家是北京、上海、武汉、成都、杭州、天津、深圳、沈阳、西安、重庆;
分别拿用户对剧本、对主持人、对环境的打分做了占比分析;
对广州剧本杀评价进行了词云统计,可以看到DM是剧本杀灵魂,带玩家穿越体验不同人生,用户对环境氛围、服务等方面比较注重;
这次的分享到这里就结束了,感谢观看,下期再见!
评论、商家、店铺都可以获取到。
标签:非常,某众,商家,Python,反爬,爬虫,字体,剧本,数据
来源: https://blog.csdn.net/qq_37275405/article/details/122124627