首页 > TAG信息列表 > RoaringBitMap
高效压缩位图在推荐系统中的应用
作者:vivo互联网技术-Ke Jiachen 一、背景 用户在浏览游戏中心/应用商店的某些模块内容时,会进行一系列滑屏操作并多次请求游戏推荐业务来进行游戏推荐展示,这段时间我们称之为一个用户session。 一个session内用户一般会进行十几次滑屏操作,每次滑屏操作都会请求推荐业务,所以在这个SPARK SQL中自定义udf,udaf函数统计uv(使用bitmap)
在实际工作中统计uv时,一般会使用count(distinct userId)的方式去统计人数,但这样效率不高,假设你是统计多个维度的数据,当某天你想要上卷维度,此时又需要从原始层开始统计,如果数据量大的时候将会耗费很多时间,此时便可以使用最细粒度的聚合结果进行上卷统计,即需要自定义聚合函数进行统roaring bitmap 与 bitmap 比较
https://zhuanlan.zhihu.com/p/351365841 是个一系列的文章 https://blog.csdn.net/yizishou/article/details/78342499 最后我们来将roaringbitmap相比于普通的bitmap的优势总结为以下几点: 内存上: bitmap比较适用于数据分布比较稠密的存储场景中,对于原始的BitmapFlink任务通过RoaringBitmap实现去重
背景 日常开发中,经常会有一些场景需要进行实时去重,实现方式多种多样,各有利弊,关键在于如何结合自己的业务场景选择适合自己的方式,咱今主要讨论如何通过RoaringBitmap实现实时去重。先来模拟一个简单的业务场景 需求:实时计算每个账户累计消费金额,通过累计消费金额触发后续动作RoaringBitmap运行机制解析
背景 用于将int类型转换成bitmap类型 public static RoaringBitmap bitmapOf(final int... dat) { final RoaringBitmap ans = new RoaringBitmap(); ans.add(dat); return ans; } 运行机制 初始化bitmap final RoaringBitmap ans = new RoaringBitmap(); 在苏宁6亿会员是如何做到快速精确分析的?
随着苏宁业务的高速发展,大数据平台对海量的业务数据分析越来越具有挑战,尤其是在精确去重、复杂 JOIN 场景下,如用户画像、UV、新老买家、留存、流失用户等。图片来自 Pexels随着苏宁业务的高速发展,大数据平台对海量的业务数据分析越来越具有挑战,尤其是在精确去重、复杂 JOIN 场景下,