其他分享
首页 > 其他分享> > 推荐系统+因果推断(二)——kdd‘21用反事实推理缓解召回阶段的数据流行度偏差Model-Agnostic Counterfactual Reasoning for EliminatingPopu

推荐系统+因果推断(二)——kdd‘21用反事实推理缓解召回阶段的数据流行度偏差Model-Agnostic Counterfactual Reasoning for EliminatingPopu

作者:互联网

 

Model-Agnostic Counterfactual Reasoning for Eliminating Popularity Bias in Recommender System

https://dl.acm.org/doi/pdf/10.1145/3447548.3467289

 本文中将会用到因果推断中反事实部分的知识,具体内容可以查看之前的文章,这里就不对反事实相关内容重复叙述了。

背景

        背景和上一篇的背景类似,都是为了解决流行数据偏差问题。想要详细了解例子的小伙伴可以查看上一篇文章(推荐系统+因果推断(一))。这里进行简述,推荐系统中我们需要给用户提供个性化的推荐,而不是什么流行推荐什么。本篇文章作用于召回阶段而非排序阶段。

贡献:

方法

分析流行性数据偏差对召回模型的影响

图片

        图(a)是传统的方式的因果图,只考虑user和item的交互,比如交互矩阵。而其中忽略了用户一致性和物品流行度对整体的影响,因此修改因果图,得到图(c)。在整个模型中,我们需要做的就是去除I->Y的影响,以此去除item流行性对最终结果的影响。

TE、NDE、TIE的概念

图片

total effect(TE) 总效应:当I=i^* 变成I=i后,所获得的效应。

图片

natual direct effect(NDE) 自然直接效应,如第三张图,中间(K)不通,也就是说I的变化只会影响到Y但是不会影响到K,当I=i^* 变成I=i后所获得的的效应。

图片

total indirect effect(TIE)总间接效应:当I=i^* 变成I=i

图片

 

MACR框架

模型结构

图片

MACR是一个多任务模型,中间橙色部分是传统的推荐模型,用户匹配user和item,即K->Y。绿色部分为U->Y,蓝色部分为I->Y。三个分支得到的最终预测分数为

图片

总体损失函数为

图片

Lo,Li,Lu为橙,蓝,绿三个分支的二分交叉熵损失函数,以Lu为例:

图片

反事实推断

图片

    通过反事实推断,将real world的因果图转变为conterfactual world反事实世界的因果图。在推理阶段,通过下式去掉I->Y这条路径从而缓解item流行性偏差问题。

图片

上式可由前述的TIE得到,c是超参数。

推导:

图片

 

图片

 

图片

 

图片

 

图片

 

 

简单总结:

    本文是首先训练了一个多任务模型,然后在推理也就是召回阶段,通常我们是得到分数,取前n个,但是此处作者考虑了数据流行性偏差问题,通过反事实推理,在推理阶段计算TIE来衡量哪个item更优,以此缓解上述问题。

更多内容可以关注“秋枫学习笔记”

 

 

标签:EliminatingPopu,偏差,21,Agnostic,item,推断,TIE,推理,因果
来源: https://blog.csdn.net/naocanmani/article/details/120470039