编程语言
首页 > 编程语言> > 【推荐算法】冷启动

【推荐算法】冷启动

作者:互联网

具体地讲,根据数据匮乏情况的不同,冷启动问题主要分为 3 类:

可以把主流的冷启动策略归纳为以下三类:

一、基于规则的冷启动过程

有以下几种策略策略:

二、 丰富冷启动过程中可获得的用户和物品特征

改进的主要方法就是在模型中加入更多用户或物品的属性特征,而非历史数据特征。

可获得的用户和物品特征可能包括以下几类:

三、利用主动学习、迁移学习和“探索与利用”机制

1. 主动学习

被动学习是在已有的数据集上建模,学习过程中不对数据集进行更改,也不会加入新的数据,而主动学习不仅利用已有的数据集进行建模,而且可以“主动”发现哪些数据是最急需的,主动向外界发出询问、获得反馈,从而加速学习过程。基于主动学习的冷启动推荐要定义推荐系统的损失函数,从而精确地评估推荐不同影片获得的损失下降收益。

2. 迁移学习

迁移学习是在某领域知识不足的情况下,迁移其他领域的数据或知识,用于本领域的学习。基于迁移学习的冷启动推荐将其他领域的数据用于支持本领域的冷启动推荐。

例如在ESMM模型中,阿里巴巴利用CTR数据生成了用户和物品的embedding,然后共享给CVR模型,这就是的CVR模型在没有转化数据时能够用CTR模型的知识完成冷启动过程。

其它比较实用的迁移学习的方法是在领域A和领域B的模型结构和特征工程相同的前提下,若领域A的模型已经得到充分的训练,则可以直接讲领域A模型的参数作为领域B模型的参数的初始值。随着领域B数据的不断积累,增量更新模型B。这样做的目的是在领域B数据不足的情况下,也能获得个性化的、较合理的初始推荐。该方法的局限性是要求领域A和领域B所用的特征必须基本一致。

3. “探索与利用”机制

“探索与利用”机制是在“探索新数据”和“利用旧数据”之间进行平衡,使系统既能够利用旧数据进行推荐,达到推荐系统的商业目标,又能高效地探索冷启动的物品是否是“优质”物品,使得冷启动物品获得曝光的倾向,快速收集冷启动数据。

具体见:【推荐算法】探索与利用

参考资料

  1. 深度学习推荐系统 王喆编著 中国工信出版集团
  2. 推荐系统冷启动问题

标签:推荐,用户,学习,算法,冷启动,物品,数据
来源: https://blog.csdn.net/qq_36643449/article/details/122599048