首页 > TAG信息列表 > u0001
交叉特征-从用户偏好说起
冗余特征 之前讲了,同一个叶子节点的用户他们具有相同的属性,即用户的绝大部分特征都是相同,举个例子看一下这样就有什么样的问题,这个问题是我对交叉特征思考的来源。 我们先将一个用户的所有数据拿出来,然后最个性化推荐,因为是同一个用户,所以用户特征都是相同的,我们假设用户特征Hive计算最大连续登陆天数
目录一、背景二、算法1. 第一步:排序2. 第二步:第二列与第三列做日期差值3. 第三步:按第二列分组求和4. 第四步:求最大次数三、扩展(股票最大涨停天数) 强哥说他发现了财富密码,最近搞了一套股票算法,其中有一点涉及到股票连续涨停天数的计算方法,我们都知道股票周末是不开市的,这里有个断关于Sqoop-Cannot understand character argument: \u0001
sqoop导出数据,报Cannot understand character argument: \u0001 解决方案: #不要用'\u0001',换成 '\001' #不要用'\u0001',换成 '\001' #不要用'\u0001',换成 '\001' #export用: --input-fields-terminated-by '\001'