延迟转化建模《Modeling Delayed Feedback in Display Advertising》论文阅读
作者:互联网
背景
在计算广告的CVR预估中存在正例回传延迟的问题,具体来说就是用户的一个click行为可能要过好几天才知道会不会发生convert(这和广告的归因逻辑有关,一般会把convert归因给n天内最后发生click的事件)。这样导致了模型训练时不知道一个样本是不是真的负样本。
其中一个朴素的解决方法时等待一个固定的时间窗口,超过这个时间窗口还没回传转化的样本都看作负样本,但是这样做的缺点是:如果时间窗口设的太短会丢失大量的正例,时间窗口设的太长模型的时效性有损。
这篇论文通过该引入一个用于捕捉转化延迟的额外模型来解决这个问题。直观地讲,这个概率模型帮忙决定一个还没有回传转化的样本是应该被当做负例,还是当做未知样本不参与训练:若现在转化还没有回传,现在距展现发生的时间间隔,如果比预估的延迟时间大,则当做负例,否则当做未知样本
建模
首先定义要用到的符号的意义:
标签:当做,窗口,Feedback,样本,Delayed,转化,Advertising,回传,延迟 来源: https://www.cnblogs.com/xumaomao/p/16119099.html