是什么影响了点击率?——广告图像在CTR预估中的应用
作者:互联网
原文链接:是什么影响了点击率?——广告图像在CTR预估中的应用,现在转载到CSDN上~
欢迎关注我的公众号,微信搜 algorithm_Tian 或者扫下面的二维码~
现在保持每周更新的频率,内容都是机器学习相关内容和读一些论文的笔记,欢迎一起讨论学习~
最近有点懒,好久没有更新啦,突然想起来被我遗忘了的公众号。。
这次简单的介绍一下最近在关注的一个方面,ctr预估中图像的应用。ctr是什么呢?就是click through rate,也就是推荐系统以及计算广告里最最重要的指标之一,点击率。一般在做ctr模型时,用到的特征都是一些比较离散或者有实际意义的特征,比如用户的地域、年龄、性别、广告的所属行业等,这些特征输入到ctr模型中进行训练预估用户点击某个广告的概率。
那么很显然,对于人来说,广告的图像占据吸引力的比重是很大的,有的图让特定的用户感兴趣,那么有这种图的广告推荐给这种用户,对点击率的提升显然是有好处的,于是将图像特征加入ctr模型中看起来也是一个make sense的事情了。
这次我超级简单的介绍一下最近看的几篇文章。
1.Image Feature Learning for Cold Start Problem inDisplay Advertising IJCAI2015 腾讯
2. DeepCTR Prediction in Display Advertising ACM MM2016 阿里
4.Image Matters:Visually modeling user behaviors using Advanced Model Server 阿里 arXiv2017
1.Image Feature Learning for Cold Start Problem inDisplay Advertising IJCAI2015 腾讯
网络结构
100*100像素的图像输入 => 4层conv+ max pool => 3层FC => softmax(2维输出,<not-click个数, click个数>)
这篇文章是单独训练一个cnn网络来得到图像特征,然后将图像特征加入到ctr模型中进行预估。在训练的时候作者将同一个广告的点击日志聚合在一起,统计一个广告图像的点击数和未点击数作为标签。
实验结果展示了什么因素影响了点击率:
2. DeepCTR Prediction in Display Advertising ACM MM2016 阿里
网络结构:
上一篇网络结构比较简单,只有四层卷积层,同时它不是端到端的模型。这篇阿里的文章整合了CNN与CTR预估模型,image embedding部分是:
pre-training【17层CNN+3层fc(fc18(1024d)+fc19(1024d)+fc20(96d))用图像分类做预训练,然后把训练好的conv层直接连接到ctr模型的fc层抛弃原有的fc层】+1层128神经元的fc,
生成的128维特征和全连接生成的128维basic feature一起输入到ctr预估的模型中进行预测。
文中探索影响点击率的因素:
左边比右边点击率高,据作者讲是因为主体与背景颜色差异大以及男模人数太多用户就不喜欢点。。
图片中的猫还有纹理文字对点击率有影响~
3. imageMatters: Jointly Train Advertising CTR Model with Image Representation of Adand User Behavior
阿里2018投AAAI被拒,后投cikm中了(这个说起来比较好玩,我是在知乎 https://www.zhihu.com/question/266544978/answer/311667048 看到aaai审稿人评价这篇文章然后原作者来讲了一下文章后来的结果)
和上篇相比,增加了用户历史浏览,
本文的创新点在于利用了UserNet,但是UseNet带来的一个弊端是,无法像之前两篇文章里将相同图片的样本聚合起来减少CNN部分的计算,因为UserNet的输入平均是37张图片的排列组合。在4096 维特征后面,又加入可训练的三个全连接层,把一张图像的特征降低到 12 维。
根据后面训练的attentive权重来看,用户对相似图片的权重明显大。(引用自这篇博文)
Adnet结构:VGGnet前14层(conv1-conv5+fc6,4096d,权重也使用预训练好的)+fc7(256d)+fc8(64d)+fc9(12d)
UserNet 的结构与 AdNet一致,区别在于,用户点击包含多张图片(平均37张),如何把多张图片的12维特征整合成单独的12维,其中有一些简单的做法如 sum、avg、max,也有一些复杂的 attentive方法。
4.Image Matters:Visually modeling user behaviors using Advanced Model Server 阿里 arXiv2017
上一篇文章中不是提到,usernet的存在使得训练会非常有难度,这篇讲了工程上创新的介绍,新提出的AMS被用于实现上一篇文章,效率高于传统的PS。主要是上一篇文章的工程介绍。
最后再来一波~
欢迎关注我的公众号,微信搜 algorithm_Tian 或者扫下面的二维码~
现在保持每周更新的频率,内容都是机器学习相关内容和读一些论文的笔记,欢迎一起讨论学习~
标签:CTR,ctr,Image,点击率,Advertising,图像,预估,广告 来源: https://blog.csdn.net/ty44111144ty/article/details/99066762