标签预测思路分析
作者:互联网
标签预测模型思路:
1. 问题描述
通过老用户的静态特征(手机品牌、性别、地域、安装的APP列表),以及用户的兴趣标签tag分数,构造模型预测新用户的兴趣标签tag。
2. 特征说明及预处理
1. 手机品牌组
原始手机品牌非常杂乱,包括各大厂商的子品牌,共计6W个。
取京东上有售的118个手机品牌,从0-118进行编号,其中0为缺省值。
这部分作为一个特征。
2. 地域组
一共237个地区(包括国外地区),由于国外地区人数分布比较多,将其保留,并从0-237进行编号,其中0为缺省值。
这部分作为一个特征。
3. 性别组
包括男性、女性、未知,从0-2进行编号,其中0为缺省值。
这部分作为一个特征。
4. applist组
这部分为128个特征。
标签:预测,特征,标签,这部分,品牌,缺省值,手机,思路 来源: https://blog.csdn.net/MusicDancing/article/details/122736870