数据库
首页 > 数据库> > T-SQL——数据透视和逆透视

T-SQL——数据透视和逆透视

作者:互联网

目录

志铭-2021年10月6日 22:50:00

0. 测试数据集及说明

0.1 准备测试数据

【测试数据1】

WITH Temp1 AS 
(
SELECT '张三' AS Name, '语文' AS Subject, 100 AS Scores
UNION ALL
SELECT '张三' AS Name, '数学' AS Subject, 90 AS Scores
UNION ALL
SELECT '张三' AS Name, '英语' AS Subject, 80 AS Scores
UNION ALL
SELECT '李四' AS Name, '语文' AS Subject, 90 AS Scores
UNION ALL
SELECT '李四' AS Name, '数学' AS Subject, 70 AS Scores
UNION ALL
SELECT '李四' AS Name, '英语' AS Subject, 60 AS Scores
)
SELECT * FROM  Temp1 

结果:
Name Subject Scores
---- ------- -----------
张三   语文      100
张三   数学      90
张三   英语      80
李四   语文      90
李四   数学      70
李四   英语      60

【测试数据2】

WITH Temp2 AS 
(
 SELECT '张三' AS Name, '八年级二班' AS Class, NULL AS 英语, NULL AS 数学, 100 AS 语文
 UNION ALL
 SELECT '李四' AS Name, '三年级二班' AS Class, 60 AS 英语, 70 AS 数学, 90 AS 语文
 UNION ALL
 SELECT '张三' AS Name, '三年级二班' AS Class, 80 AS 英语, 90 AS 数学, NULL AS 语文
 )
SELECT * FROM Temp2 

结果:
Name Class      英语          数学          语文
---- ---------- ----------- ----------- -----------
张三   八年级二班      NULL        NULL        100
李四   三年级二班      60          70          90
张三   三年级二班      80          90          NULL

0.2 对一维表和二维表理解

测试数据1:

测试数据2:

一维表和二维表对比:



1. 透视转换

1.1 使用标准SQL进行数据透视

--注意这里实现业务场景,在CASE WHEN语句中
--我们应该使用默认的ELSE NULL ,而不是ELSE 0。没有数据是没有数据,0是0
SELECT Name,
	   SUM(CASE WHEN Subject ='语文' THEN Temp1.Scores ElSE NULL END) AS 语文 ,
	   SUM(CASE WHEN Subject ='数学' THEN Temp1.Scores ELSE NULL END) AS 数学 ,
	   SUM(CASE WHEN Subject ='英语' THEN Temp1.Scores ELSE NULL END) AS 英语 
FROM Temp1  GROUP BY Temp1.Name

结果:
Name     英语          数学          语文
----   ----------- ----------- -----------
李四      60           70            90
张三      80           90            100

【说明】:使用标准的SQL语句进行数据的透视转换,我们可以直白的发现透视转换,是分为三个阶段的:

分组-->扩展-->聚合

以上例说明:

对照上述三个逻辑步骤:

1.2 使用T-SQL中pivot函数进行数据透视

【函数】:pivot
【作用】:行转列函数,SQL Server2005
【语法】:pivot(任一聚合函数 for 需转列的值所在列名 in (需转为列名的值))
【用法】:select …from table pivot(……) as T

【示例1】:
现有一张成绩表,表中记录了每个学生每科目的成绩,如下。
现在需要将科目作为列头,统计每个学生的成绩。

WITH Temp1 AS 
(
SELECT '张三' AS Name, '语文' AS Subject, 100 AS Scores
UNION ALL
SELECT '张三' AS Name, '数学' AS Subject, 90 AS Scores
UNION ALL
SELECT '张三' AS Name, '英语' AS Subject, 80 AS Scores
UNION ALL
SELECT '李四' AS Name, '语文' AS Subject, 90 AS Scores
UNION ALL
SELECT '李四' AS Name, '数学' AS Subject, 70 AS Scores
UNION ALL
SELECT '李四' AS Name, '英语' AS Subject, 60 AS Scores
)
SELECT T.Name, T.英语, T.数学, T.语文 FROM Temp1 PIVOT(SUM(Scores) FOR [Subject] IN (语文,数学,英语)) T;

结果:
Name  英语          数学          语文
---- ----------- ----------- -----------
李四   60            70          90
张三   80            90          100

【注意1】:
我们是按照以下格式:
select …from table pivot(任意聚合函数(聚合字段) for 待扩展字段名 in (待扩展元素集)) as T
使用pivot对table进行数据透视

若是table中的字段既不是聚合字段,又不是待扩展字段,则会默认为pivot函数中的分组依据的字段。

所以使用pivot函数进行数据透视的结果集一般不会是数据库中的原表,而是一个查询出的特定字段的结果集

【注意2】:
若待扩展元素集是非常规标识符,比如说日期或数字开头的其他类型数据,则我们需要使用方括号将每一个待扩展展元素括起。

【示例2】:

现在在测试数据1中添加一个Class字段,使用pivot函数透视数据

WITH Temp1 AS 
(
SELECT '张三' AS Name, '语文' AS Subject, 100 AS Scores,'八年级一班' AS Class
UNION ALL
SELECT '张三' AS Name, '数学' AS Subject, 90 AS Scores,'三年级二班' AS Class
UNION ALL
SELECT '张三' AS Name, '英语' AS Subject, 80 AS Scores,'三年级二班' AS Class
UNION ALL
SELECT '李四' AS Name, '语文' AS Subject, 90 AS Scores,'三年级二班' AS Class
UNION ALL
SELECT '李四' AS Name, '数学' AS Subject, 70 AS Scores,'三年级二班' AS Class
 UNION ALL
 SELECT '李四' AS Name, '英语' AS Subject, 60 AS Scores,'三年级二班' AS Class
)
SELECT T.Name,T.Class, T.英语, T.数学, T.语文 FROM Temp1 PIVOT(SUM(Scores) FOR [Subject] IN (语文,数学,英语)) T;

结果:

Name      Class      英语          数学          语文
---- ---------- ----------- ----------- -----------
张三   八年级一班      NULL        NULL        100
李四   三年级二班      60          70          90
张三   三年级二班      80          90          NULL

【说明】:结果集Temp1中的class既不是聚合字段,也不是待扩展字段,所以会被默认为是分组依据!

而往往,我们期望的分组依据只要Name字段,

所以一般都是建议不要直接对数据库中的基础表进行透视操作,而是将特定字段查询出来作为一个表结果集,之后在对这个结果集进行透视操作。

1.3 关于 待扩展元素集合获取的方式



2. 逆透视转换

【逆透视】:逆透视转换将来自单个记录中多个列的值扩展为单个列中具有同样值的多个记录,使得非规范的数据集成为较规范的版本。

2.1 使用标准SQL进行数据逆透视

数据的逆透视也是分为三步:请客,斩首,收下当狗

啊唾,不对,应该是是:生成副本-->提取元素-->删除不相干交叉


WITH Temp AS 
(
	--测试数据集
 	SELECT '张三' AS Name, '八年级二班' AS Class, NULL AS 英语, NULL AS 数学, 100 AS 语文
 	UNION ALL
 	SELECT '李四' AS Name, '三年级二班' AS Class, 60 AS 英语, 70 AS 数学, 90 AS 语文
 	UNION ALL
 	SELECT '张三' AS Name, '三年级二班' AS Class, 80 AS 英语, 90 AS 数学, NULL AS 语文
 )
 ,Temp1 AS 
 (
	--为每一行生成副本
	--与需要逆透视的列交叉连接获取笛卡尔积
 	SELECT * FROM  Temp CROSS JOIN( VALUES('英语'),('数学'),('语文')) AS T(SubjectName)
	--结果
	--Name	Class	   英语	   数学	   语文	    SubjectName
	--张三	八年级二班	NULL	NULL	100	    英语
	--张三	八年级二班	NULL	NULL	100	    数学
	--张三	八年级二班	NULL	NULL	100	    语文
	--李四	三年级二班	60	    70	    90	    英语
	--李四	三年级二班	60	    70	    90	    数学
	--李四	三年级二班	60	    70	    90	    语文
	--张三	三年级二班	80	    90   	NULL	英语
	--张三	三年级二班	80	    90  	NULL	数学
	--张三	三年级二班	80	    90  	NULL	语文
 )
 ,Temp2 AS
 (
	 --当前行SubjectName为英语则取英语列
	SELECT Name,Class,Temp1.SubjectName,
        CASE Temp1.SubjectName
           WHEN '英语' THEN
               英语
           WHEN '数学' THEN
               数学
           WHEN '语文' THEN
               语文
        END AS Scores
    FROM Temp1
	--结果
	--Name	Class	SubjectName	Scores
	--张三	八年级二班	英语	NULL
	--张三	八年级二班	数学	NULL
	--张三	八年级二班	语文	100
	--李四	三年级二班	英语	60
	--李四	三年级二班	数学	70
	--李四	三年级二班	语文	90
	--张三	三年级二班	英语	80
	--张三	三年级二班	数学	90
	--张三	三年级二班	语文	NULL
)
--删除不相关交叉行(排除NULL值行)
SELECT * FROM Temp2 WHERE  Temp2.Scores IS NOT NULL

--结果
--Name	Class	SubjectName	Scores
--张三	八年级二班	语文	100
--李四	三年级二班	英语	60
--李四	三年级二班	数学	70
--李四	三年级二班	语文	90
--张三	三年级二班	英语	80
--张三	三年级二班	数学	90

2.2 使用T-SQL中unpivot函数进行数据逆透视

【函数】:unpivot
【作用】:列转行函数,SQL Server2005
【语法】:unpivot(作为属性值列的列名 for 属性名 in (同一属性的列名))
【用法】:select …from table unpivot(……) as T

【示例1】


WITH Temp2 AS 
(
 SELECT '张三' AS Name, '八年级二班' AS Class, NULL AS 英语, NULL AS 数学, 100 AS 语文
 UNION ALL
 SELECT '李四' AS Name, '三年级二班' AS Class, 60 AS 英语, 70 AS 数学, 90 AS 语文
 UNION ALL
 SELECT '张三' AS Name, '三年级二班' AS Class, 80 AS 英语, 90 AS 数学, NULL AS 语文
 )
SELECT * FROM Temp2 UNPIVOT(Socore FOR Subject IN(英语, 数学, 语文)) T;

结果:
Name    Class        Socore      Subject
----   ----------   --------    ----------
张三   八年级二班      100         语文
李四   三年级二班      60          英语
李四   三年级二班      70          数学
李四   三年级二班      90          语文
张三   三年级二班      80          英语
张三   三年级二班      90          数学


3. 透视之后再逆透视数据信息减少

上面的示例数据中,将原数据(测试数据1)进行透视操作,变为测试数据2。将测试数据2逆透视结果变回了测试数据1。

这只是巧合而已,因为我们的测试数据1中没有出现相同属性(同一个人相同科目)的多条记录:
比如说,如果李四有两条英语成绩如下:

WITH Temp1 AS 
(
SELECT '张三' AS Name, '语文' AS Subject, 100 AS Scores
UNION ALL
SELECT '张三' AS Name, '数学' AS Subject, 90 AS Scores
UNION ALL
SELECT '张三' AS Name, '英语' AS Subject, NULL AS Scores--张三英语成绩没有记录
UNION ALL
SELECT '李四' AS Name, '语文' AS Subject, 90 AS Scores
UNION ALL
SELECT '李四' AS Name, '数学' AS Subject, 70 AS Scores
UNION ALL
SELECT '李四' AS Name, '英语' AS Subject, 60 AS Scores--李四有两条英语成绩
UNION ALL
SELECT '李四' AS Name, '英语' AS Subject, 60 AS Scores--李四有两条英语成绩
)
,Temp2 AS --数据透视
(
SELECT * FROM  Temp1  PIVOT(SUM(Scores) FOR Subject IN (语文,数学,英语))AS T
)
SELECT * FROM Temp2 UNPIVOT(Scores FOR Subject IN (语文,数学,英语))AS T

透视结果:

Name    语文          数学          英语
----   ----------- ----------- -----------
李四     90           70            120
张三     100          90            NULL

对透视结果逆透视:

Name Scores      Subject
---- ----------- -------------
李四   90          语文
李四   70          数学
李四   120         英语--这里逆透视就无法还原为原始数据(这里就是聚合成一条数据了)
张三   100         语文
张三   90          数学
					   --张三英语为NULL的记录在原始数据中是存在,而透视再逆透视后则没有了

之前详述了透视包含三个逻辑步骤,分组-->扩展-->聚合。

因为透视包含了聚合,表的信息量减少了,所以在做逆透视无法还原成原始数据。

简单的说:

UNPIVOT 并不完全是 PIVOT 的逆操作。
PIVOT 执行聚合,并将多个可能的行合并为输出中的一行。
UNPIVOT 不重现原始表值表达式的结果,因为行已被合并。

另外,UNPIVOT 输入中的 NULL 值也在输出中消失了。
如果值消失,表明在执行 PIVOT 操作前,输入中可能就已存在原始 NULL 值。



4. 参考

标签:Name,Scores,--,透视,二班,SQL,90,数据,SELECT
来源: https://www.cnblogs.com/shanzhiming/p/15371249.html