硬核 教你如何使用自服务数据集
作者:互联网
联接联合和数据库中的用法是一样的,可以将不同数据表的数据整合到一起,只不过BI针对的是数据集,不仅可以跨数据库,还可以跨数据源,比如sql数据源和excel数据源,只要有对应的字段就可以组合。
内部联接
做联接要求两个数据集有相同的字段,名字和类型都要相同,根据选择的联接类型,得出需要的结果集。此处选择的内联接,结果为两个数据集根据ID字段得出的交集。
联合
联合要求两个数据集的字段名和字段类型完全相同,效果相当于把A表的数据添加到B表后面。
抽样
有几个比较简单的功能,抽样是从数据集中随机抽取对应行数的数据;排序可以指定数据集按照哪个字段排序;镜像是复制一份源节点的数据,源节点改变,镜像也会跟着改变,源节点改变后,镜像会有提示,刷新即可;去重是去掉重复的整行数据,前提是重复行所有字段的数据都重复了。
透视表原数据集
透视表节点设置
透视表结果
行转列就是透视表的功能,只需要选择转换的字段,就可以轻松将行转换为列。上面例子中是将科目字段的数据,语数外三科,转换为列表头,值列为分数,效果就是每个人每科对应的分数。
逆透视表原数据
逆透视表节点设置
逆透视结果
逆透视表和透视表的效果是相反的,是将多个字段合并为一个字段。上述例子中,将语文数学英语这三个字段名作为数据,生成一个新的字段,原字段的值生成为另一个字段。
分组汇总
分组汇总的效果相当于GROUP BY,可以指定数据按照哪列做汇总,例子中是销量和销售额根据产品种类求和。
自循环列原数据集
层级设置
自服务数据集结果
自循环列是用来分离字段层级关系的,上述例子中的部门ID列,每一位对应不同的部门层级,第一位表示总部,第二位表示各个分部,第三位表示部门员工等级。通过设置分级长度,即多少位表示一个部门,例子中一位表示一个部门,设置长度为一,结果就是根据部门层级,将部门名称和人数分离开来。
自服务数据集功能强大,省略了复杂的sql语句,通过图形化界面展示,只需要连接对应的功能节点,就可以实现数据的清理整合,非常方便
我是做数据的小狗
汪!
标签:层级,服务,透视,数据源,联接,数据,节点,硬核 来源: https://blog.csdn.net/Wudixiaochi/article/details/121905264