[数据仓库/数据治理]浅谈拉链表
作者:互联网
拉链表 概述
什么是拉链表
?
拉链表,其实是数仓工程师针对变化数据的修改问题
的一种解决方案下的某一类同一性质的表。
拉链表是针对数据仓库设计中表存储数据的方式而定义的,顾名思义,所谓拉链,就是记录历史。记录一个事物从开始,一直到当前状态的所有变化的信息。
拉链表的好处?
既可以保存历史数据,也可以防止数据的冗余。
在企业中为什么要使用拉链表呢?
比如:用户的任一一个增、删,改操作,若都对一条数据进行存储,这样就会出现大量重复的冗余数据,增加不必要的存储空间。
拉链表的缺点?
降低系统检索、处理数据的效率。
X 参考文献
标签:存储,浅谈,拉链,数据仓库,Hive,数据,冗余 来源: https://www.cnblogs.com/johnnyzen/p/14702870.html