数据库
首页 > 数据库> > Task05: SQL高级处理

Task05: SQL高级处理

作者:互联网

目录

5.1 窗口函数知识整理

5.2 举例说明

5.3 练习题(macOS)


5.1 窗口函数知识整理

 

用法

说明

窗口函数

OLAP函数,OnLine Analytic Processing,对数据库数据实时分析处理

<窗口函数> OVER ([PARTITION BY <列名>]
                ORDER BY <排序用列名>) 

*[]中的内容可以省略

  • PATITION BY:分组,确定窗口大小,类似于GROUP BY分组功能

  • PATITION BY vs GROUP BY:前者不会改变返回的记录行数,GROUP BY返回汇总后的行数

  • ORDER BY:排序,决定窗口内的排序规则

  • ORDER BY默认升序,可通过ASC/DESC指定升/降序

专用窗口函数

RANK:如果有并列名次,会占用下一名词的位置;例如1,1,1,4

DENSE_RANK:如果有并列名字,不占用下一名次的位置;例如1,1,1,2

ROW_NUMBER:不考虑并列名字;例如1,2,3,4

 

聚合函数在窗口函数中

SUM、MAX、MIN等聚合函数:聚合函数作为窗口函数,可以在每一行的数据里直观的看到,截止到本行数据,统计数据是多少(最大值、最小值等)。同时可以看出每一行数据,对整体统计数据的影响。

 

指定窗口汇总范围

<窗口函数> OVER (ORDER BY <排序用列名>
                 ROWS n PRECEDING )  
                 
<窗口函数> OVER (ORDER BY <排序用列名>
                 ROWS BETWEEN n PRECEDING AND n FOLLOWING)

 

  • PRECEDING(“之前”), 将框架指定为 “截止到之前 n 行”,+ 自身行

  • FOLLOWING(“之后”), 将框架指定为 “截止到之后 n 行”,+ 自身行

  • BETWEEN 1 PRECEDING AND 1 FOLLOWING,将框架指定为 “之前1行” + “之后1行” + “自身”

合计

ROLLUP:计算分类(GROUP BY)的合计

SELECT <column_name>, <column_name>, ...
FROM <table>
GROUPY BY <column_name> WITH ROLLUP

 

  • GROUPY:计算每个分类的小计

  • ROLLUP:计算分类的合计

5.2 举例说明

Task02: 基础排序与查询中的product表为例,product表如下:

对sale_price进行RANK(),DENSE_RANK(),ROW_NUMBER(),用`括住rank,dense_rank,row_number表明其不为关键字:

SELECT product_id, product_name, product_type, sale_price
	   , RANK() OVER (ORDER BY sale_price) AS `rank`
	   , DENSE_RANK() OVER (ORDER BY sale_price) AS `dense_rank`
	   , ROW_NUMBER() OVER (ORDER BY sale_price) AS `row_number` 
FROM product;

结果如下:

对sale_price进行SUM(),AVG()窗口函数:

SELECT product_id, product_name, product_type, sale_price
	   , SUM(sale_price) OVER (ORDER BY sale_price) AS cumulative_sum
	   , AVG(sale_price) OVER (ORDER BY sale_price) AS cumulative_avg
FROM product;

结果如下:

根据product_type分组对sale_price进行SUM(),AVG()窗口函数:

SELECT product_id, product_name, product_type, sale_price
	   , SUM(sale_price) OVER (PARTITION BY product_type ORDER BY sale_price) AS cumulative_sum
	   , AVG(sale_price) OVER (PARTITION BY product_type ORDER BY sale_price) AS cumulative_avg
FROM product;

结果如下: 

PRECEDING/FOLLOWING/BETWEEN AND的应用:

SELECT  product_id
       ,product_name
       ,sale_price
       ,AVG(sale_price) OVER (ORDER BY product_id ROWS 2 PRECEDING) AS preceding_avg
       ,AVG(sale_price) OVER (ORDER BY product_id ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING) AS between_avg  
FROM product; 

结果如下:

ROLLUP计算GROUP BY合计:

SELECT product_type, regist_date
	   , SUM(sale_price) AS sum_price 
FROM product
GROUP BY product_type, regist_date WITH ROLLUP;

结果如下:

5.3 练习题(macOS)

1. 请说出针对本章中使用的 product(商品)表执行如下 SELECT 语句所能得到的结果。

SELECT  product_id
       ,product_name
       ,sale_price
       ,MAX(sale_price) OVER (ORDER BY product_id) AS Current_max_price
  FROM product

说明:从product表中选出product_id,product_name,sale_price,已经每个截止到每个product_id范围内最大的sale_price

2. 继续使用product表,计算出按照登记日期(regist_date)升序进行排列的各日期的销售单价(sale_price)的总额。排序是需要将登记日期为NULL 的“运动 T 恤”记录排在第 1 位(也就是将其看作比其他日期都早)

利用SUM()作为窗口函数,并以regist_date排序:

SELECT *
       , SUM(sale_price) OVER (ORDER BY regist_date) as total_sale_price
FROM product;

结果如下:

3.  思考题

① 窗口函数不指定PARTITION BY的效果是什么?

说明:PARTITION BY用来分组,即指定窗口大小,不指定PARTION BY即窗口为整个表(没有任何筛选条件)。

② 为什么说窗口函数只能在SELECT子句中使用?实际上,在ORDER BY 子句使用系统并不会报错。

说明:因为窗口函数操作的是,经过WHERE或者GROUP BY子句后的数据,所以放在SELECT子句中。

 

标签:product,price,sale,高级,SELECT,SQL,Task05,ORDER,OVER
来源: https://blog.csdn.net/weixin_47171389/article/details/111499418