首页 > TAG信息列表 > gulivideo
大数据技术之Hive 第11章 Hive实战
第11章 Hive实战 11.1 需求描述 统计硅谷影音视频网站的常规指标,各种TopN指标: -- 统计视频观看数Top10 -- 统计视频类别热度Top10 -- 统计出视频观看数最高的20个视频的所属类别以及类别包含Top20视频的个数 -- 统计视频观看数Top50所关联视频的所属类别Rank -- 统计每个类别中的Hive之例题
1.统计视频观看数Top10 select videoId, rank()over(order by views desc) from gulivideo_orc limit 10 +--------------+----------------+ | videoid | rank_window_0 | +--------------+----------------+ | dMH0bHeiRNg | 1 | | 0XxI-hvPRRAHive基础(四十):Hive 实战(一)准备
1 需求描述 统计硅谷影音视频网站的常规指标,各种 TopN 指标: -- 统计视频观看数 Top10 -- 统计视频类别热度 Top10 -- 统计出视频观看数最高的 20 个视频的所属类别以及类别包含 Top20 视频的个数 -- 统计视频观看数 Top50 所关联视频的所属类别排序 -- 统计每个类别中的视频热度 Thive从入门到实战五
第10章 Hive实战之谷粒影音 10.1 需求描述 统计硅谷影音视频网站的常规指标,各种TopN指标: 统计视频观看数Top10 统计视频类别热度Top10 统计出视频观看数最高的20个视频的所属视频类别以及对应视频类别的个数 统计视频观看数Top50所关联视频的所属类别Rank 统计每个类别中工作中常见的hive语句总结
hive的启动: 1、启动hadoop2、开启 metastore 在开启 hiveserver2服务nohup hive --service metastore >> log.out 2>&1 &nohup hive --service hiveserver2 >> log.out 2>&1 &查看进程是否起起来:tandemac:bin tanzhengqiang$ jps -ml | grep Hive 数据结构day06
今天学 习过程 和小结 一、 Hive查询操作 1.1 全表和特定列查询 1、全表查询:select * from emp;一般不使用select *,因为会降低效率,在企业中根据需要查询列。 2、特定列查询:select 列名,列名… from emp;这种查询在企业中常用。 1.