基于Tag标签的推荐-推荐系统
作者:互联网
推荐系统-基于Tag标签的推荐
文章目录
个人介绍
杨晓栋,对世界保持好奇心。
可以使用Tensorflow,进行一些基础模型的搭建,修改和训练工作。
与叶言威,刘瀚乾同学一起努力完成一项大创项目。
未来希望可以有一家属于自己的书店。
基于标签的推荐
基于标签的推荐在我们的生活中很常见。音乐网站,豆瓣,视频网站,这些与文娱相关的网站,随处可见标签的影子。豆瓣的电影标签、书籍标签,网易云音乐的音乐标签,B站的视频标签。属于基于内容的推荐算法。
推荐系统遇到信息过载的时候才有必要,很显然,当书店是一个小书店的时候,书并不多,也不需要推荐系统,只需要简单的分类即可。
我们这里主要讲一个简单的基于标签的推荐算法。
SimpleTagBased
p
(
u
,
i
)
=
∑
b
n
u
,
b
n
b
,
i
p(u, i)=\sum_{b} n_{u, b} n_{b, i}
p(u,i)=b∑nu,bnb,i
$n_{u, b}
是
用
户
是用户
是用户u
打
过
标
签
打过标签
打过标签b
的
次
数
,
的次数,
的次数,n_{b, i}
是
物
品
是物品
是物品i
被
打
过
标
签
被打过标签
被打过标签b$的次数。通过标签将用户将物品连接起来。可解释强,会让读者觉得标签是有道理的,基于标签推荐出书也是有道理的。
而标签这种特征表现形式,建立起用户和商品联系,标签是联系用户和物品的纽带。
TagBasedTFIDF
p
(
u
,
i
)
=
∑
b
n
u
,
b
log
(
1
+
n
b
(
u
)
)
n
b
,
j
p(u, i)=\sum_{b} \frac{n_{u, b}}{\log \left(1+n_{b}^{(u)}\right)} n_{b, j}
p(u,i)=b∑log(1+nb(u))nu,bnb,j
SimpleTagBased不能反应用户个性化的兴趣,这里我们可以借鉴TF-IDF的思想,对这一公式进行改进。
n
b
(
u
)
n_{b}^{(u)}
nb(u)记录了标签
b
b
b被多少用户使用过
TagBasedTFIDF++
p
(
u
,
i
)
=
∑
b
n
u
,
b
log
(
1
+
n
b
(
u
)
)
n
b
,
i
log
(
1
+
n
i
(
u
)
)
p(u, i)=\sum_{b} \frac{n_{u, b}}{\log \left(1+n_{b}^{(u)}\right)} \frac{n_{b, i}}{\log \left(1+n_{i}^{(u)}\right)}
p(u,i)=b∑log(1+nb(u))nu,blog(1+ni(u))nb,i
同理我们可以再加入对热门物品进行惩罚。
n
b
(
u
)
n_{b}^{(u)}
nb(u)记录了标签
b
b
b被多少用户使用过,
n
i
(
u
)
n_{i}^{(u)}
ni(u)记录了物品
i
i
i被多少用户标记过。
文娱推荐举例——视频
p
(
u
,
i
)
=
∑
b
Q
n
u
,
b
log
(
1
+
n
b
(
u
)
)
n
b
,
i
log
(
1
+
n
i
(
u
)
)
R
p(u, i)=\sum_{b} {Q}\frac{n_{u, b}}{\log \left(1+n_{b}^{(u)}\right)} \frac{n_{b, i}}{\log \left(1+n_{i}^{(u)}\right)}{R}
p(u,i)=b∑Qlog(1+nb(u))nu,blog(1+ni(u))nb,iR
再加入我们考虑视频本身的质量因素
R
R
R(可以是带时间衰减的观看次数,也可以是上线之后的CTR),再考虑标签本身的质量
Q
Q
Q
文娱推荐举例——豆瓣
对用户进行了引导,豆瓣利用标签讲用户的推荐结果作了聚类,显示了对不同标签下用户的推荐结果,增加了推荐的多样性和可解释性。
最终组织页面,提高了推荐结果的多样性,因为读者的兴趣可能在长时间是广泛的,但是某一天比较具体,我们想要在某一天击中用户当天的兴趣,通过标签云,展示了所有读者的兴趣,让读者根据他今天的兴趣去选择相关的标签,得到参考结果,提高了推荐结果的多样性,是推荐结果更容易满足用户多样的兴趣。
总结和个人看法
基于标签的推荐属于基于内容的推荐算法。
基于内容的推荐优点如下:
- 用户之间的独立性。
- 好的可解释性
- 新的item可以立刻得到推荐
基于内容的推荐缺点如下:
- item的特征抽取一般很难。优质的社区,会贡献优质的Tag,实现良性循环,一些电影,书的Tag是人类主观上,高层次的抽取。
- 无法挖掘出用户的潜在兴趣。最后的组织页面在一定程度上解决这个问题(实质上没有解决)。
- 无法为新用户产生推荐。在注册时让用户选一些标签。
基于上面的分析,我认为对于文娱的推荐,基于标签的是不错的选择。文娱类作品区别于电商产品,文娱网站中的电影,书,视频是有内容的,自身都有区别与其他作品的特性,没有哪个作家希望自己的书和别人完全相同,而这些作品也有着一些共性,是有温度的,而用户的这些标签,像是书签,注脚,提炼概况他的内容。这些作品会容易引起人们的共鸣,优质的社区会有同样会有优质的评价和Tag。顾客和读者也就愿意分享他们的感受和评价,而这些Tag是他们的理解,他本身的内容就很好的特征,是人类主观上,高层次的抽取。
因此我认为对于文娱的推荐,基于标签的推荐是不错的选择
愿意分享他们的感受和评价,而这些Tag是他们的理解,他本身的内容就很好的特征,是人类主观上,高层次的抽取。
因此我认为对于文娱的推荐,基于标签的推荐是不错的选择
参考资料:《推荐系统实践》
标签:基于,log,文娱,标签,推荐,用户,Tag 来源: https://blog.csdn.net/qq_45175218/article/details/111186190