其他分享
首页 > 其他分享> > 硬核 教你如何使用自服务数据集

硬核 教你如何使用自服务数据集

作者:互联网

联接联合和数据库中的用法是一样的,可以将不同数据表的数据整合到一起,只不过BI针对的是数据集,不仅可以跨数据库,还可以跨数据源,比如sql数据源和excel数据源,只要有对应的字段就可以组合。

图片

内部联接

做联接要求两个数据集有相同的字段,名字和类型都要相同,根据选择的联接类型,得出需要的结果集。此处选择的内联接,结果为两个数据集根据ID字段得出的交集。

图片

联合

联合要求两个数据集的字段名和字段类型完全相同,效果相当于把A表的数据添加到B表后面。

图片

抽样

有几个比较简单的功能,抽样是从数据集中随机抽取对应行数的数据;排序可以指定数据集按照哪个字段排序;镜像是复制一份源节点的数据,源节点改变,镜像也会跟着改变,源节点改变后,镜像会有提示,刷新即可;去重是去掉重复的整行数据,前提是重复行所有字段的数据都重复了。

图片

透视表原数据集

图片

透视表节点设置 

图片

透视表结果

行转列就是透视表的功能,只需要选择转换的字段,就可以轻松将行转换为列。上面例子中是将科目字段的数据,语数外三科,转换为列表头,值列为分数,效果就是每个人每科对应的分数。

图片

逆透视表原数据

图片

逆透视表节点设置

图片

逆透视结果

逆透视表和透视表的效果是相反的,是将多个字段合并为一个字段。上述例子中,将语文数学英语这三个字段名作为数据,生成一个新的字段,原字段的值生成为另一个字段。

图片

分组汇总

分组汇总的效果相当于GROUP BY,可以指定数据按照哪列做汇总,例子中是销量和销售额根据产品种类求和。

图片

自循环列原数据集

图片

层级设置

图片

自服务数据集结果

自循环列是用来分离字段层级关系的,上述例子中的部门ID列,每一位对应不同的部门层级,第一位表示总部,第二位表示各个分部,第三位表示部门员工等级。通过设置分级长度,即多少位表示一个部门,例子中一位表示一个部门,设置长度为一,结果就是根据部门层级,将部门名称和人数分离开来。

自服务数据集功能强大,省略了复杂的sql语句,通过图形化界面展示,只需要连接对应的功能节点,就可以实现数据的清理整合,非常方便

我是做数据的小狗

汪!

标签:层级,服务,透视,数据源,联接,数据,节点,硬核
来源: https://blog.csdn.net/Wudixiaochi/article/details/121905264