其他分享
首页 > 其他分享> > 大四阶段——数据基础——如何辨别虚假流量

大四阶段——数据基础——如何辨别虚假流量

作者:互联网

思考

我们可以基于哪些指标去怀疑流量的真实性?
首先我们需要对网站的流量进行过滤,仅对一家广告商带来的流量进行分析
这是我们以下指标运用的前提。

一、流量的地域来源

通常访问网站的访客会来自各个不同的地理位置。所以在地图覆盖图报告中可以看到很多不同地区的流量来源。
而虚假流量通常很难使用多个地区的不同IP来产生流量。
所以通过地区覆盖图来看,如果流量来源都集中在一个地区,这部分流量就很可疑了。
当然,你广告也有可能只针对某个地区的访客投放,这样的话,访客的地理范围可能就不适用了。
又或者你遇到了更加智能的流量,比如人肉流量,那么你可以尝试使用其它的指标去进行分析。
流量地域分布

二、流量的产生时间

这里的时间要分为两个维度,一种是将时间维度拉长,观察全年一个时间线的流量分布。
另外一种将时间精确到每个小时的访问数据,观察24小时的流量分布。
通常,网站正常的访问流量会分布在一天中的各个时段,即使有访问高峰,在分布图中也会是较为平滑的曲线。
而虚假流量是人为控制产生的流量。为节省成本不会在意流量的时间分布,所以会在发现流量突增的情况。
所以,如果流量过于集中在某个时段,或者在某个时段有了不正常的增长。这部分流量就可疑了。
当然也不排除有的程序会计算好日期和时间端,并按时间曲线模拟点击。如果碰到这种“智能流量”的情况,就要使用其它的指标去进行分析。
流量趋势图
如图中标注的9月28、29号的流量就很可疑。

三、流量的跳出率

跳出率不仅仅可以反映页面的质量,也可以反映初流量的质量。
在没有进行页面改动的情况下,如果发现某个时间段的跳出率突然增高,那么对那个时间段的流量进行多个指标的综合对比,可能会发现一些可以的情况。

四、流量的网络属性

我们也可以通过流量的网络服务提供商来看出一些东西。
正常情况下,网站访问者的接入方式应该是多样化的,而虚假流量的接入方式就会很单一。
这个指标对于国内的朋友来说可能并不友好(三大运营商几乎垄断了整个行业)
还有就是现在虚假流量发展的非常高级,对于所谓的人肉流量,我们是很难分辨出来的。

五、访问路径

通常我们会制作一个着陆页去承载广告流量,但是访问者来到网站后会有不同的行为,观看不同的信息或者访问不同的板块,并且在不同的页面结束对网站的访问,这些都是虚假流量很难完成的事情,所以,当我们发现流量的访问路径和结束页面基本相同的时候,我们就应该对这部分流量保持怀疑。

六、回访用户

通常情况下,当一定数量的用户来到你的网站后,总会有一部分访问者会进行回访,即使这部分访问者可能很会少。这就像在网站中,有的链接虽然藏得很深,但是总还是会有人去点击它。因此,在分析来自一个渠道的流量时,适当的拉大时间维度来分析回访用户也是辨别虚假流量的一种方法。

七、其它

很多指标也可以帮助我们判断流量的质量:
比如网站的停留时长,这个指标虽然会受到cookie30分钟生存期的影响,让它看起来并不是那么准确,但是这个指标却与虚假流量的成本有直接的关系,所以也可以起到一定的辅助作用。
业务目标,对于虚假流量来说,业务目标的完成度是一个终结性的指标,特别是需要完成实际购买的业务目标,但是影响业务目标的因素有很多,我们需要综合的去分析。
单页面刷新,单页面刷新的行为可以降低网站的跳出率,这类流量但从跳出率这个指标上来看会觉得表现很好,但是却完全没有更多的交互行为,我们可以通过Pageviews / Unique Pageviews 这个指标去观察这种行为的情况。
点击次数、滚动次数,当我们发现网站的访问时长、跳出率等指标表现情况都很好的时候,却发现点击次数以及滚动次数很低,那么我们应该对一些指标的情况保持怀疑,进行更深一步的分析。
还有我能想到的比如页面的长尾分析着陆页的用户留存线注意力热图等等,都可以帮助我们去判断流量的情况。

八、总结

对于虚假流量的分析,我们要保持对数据敏感性,从多个指标进行综合分析,当发现某一项指标异常的时候,也要思考一下,是否是收到了某一项运营工作的影响。

标签:访问,网站,虚假,大四,流量,指标,辨别,页面
来源: https://blog.csdn.net/weixin_45209942/article/details/114270419