【榜单】院线榜单
作者:互联网
一、融合策略
1、热度榜
(1)数据源
猫眼热度排序、淘票票热度排序
(2)融合策略
a.策略一 : 平均排名
不填充数据,有一个排名,就以一个作为基准;有两个排名,就计算两个的平均值。
(3)热度值转换
上述策略得到的score是平均排名,score越小,热度越热,score越大,热度越低。
根据业务需要,将该排名映射为10000以内的数,最终选择的映射函数是反正切函数,核心代码如下:
val hot = 10000 - 2 / math.Pi * FastMath.atan(index / 40) * 10000
2、口碑榜
(1)数据源
豆瓣评分、猫眼评分、淘票票评分
(2)融合策略
a. 只有一种评分
豆瓣(0.99)、猫眼(0.95)、淘票票(0.92)
b. 只有两种评分
i. 有豆瓣(豆瓣0.6,其他0.4)
ii. 无豆瓣(猫眼0.65,淘票票0.35)
c. 三种都有
0.5 * 豆瓣 + 0.3 * 猫眼 + 0.2 * 淘票票
(3)2022.01.21最新策略
只过滤出含有豆瓣评分的院线电影,并直接根据豆瓣评分进行排序
3、票房榜
(1)数据源
猫眼、淘票票(暂时没有数据)
(2)数据融合策略
票房是统一的口径,融合时先碰到哪个平台有票房,就用哪个平台的票房数据
(3)排序
将字符串票房转换成Double型的数字,该数字的含义是<百万>,票房榜只需据此降序排列即可。
标签:榜单,评分,热度,淘票票,豆瓣,数据源,院线,猫眼 来源: https://www.cnblogs.com/renyang/p/16487828.html