其他分享
首页 > 其他分享> > 数据仓库建模

数据仓库建模

作者:互联网

DataWareHouse数据建模

文章目录

什么是数据建模?

顾名思义就是建立数据仓库模型,所以我们要先了解以下的问题

什么是数据模型?

数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体和实体之间联系的形式,来表示现实世界中事务的相互关系的一种映射

在这里,数据模型表现的是实体和实体之间的关系,通过对实体和实体之间关系的定义和描述,来表达实际业务中具体的业务关系。

数据仓库模型是数据模型中针对特定的数据仓库应用系统的特定模型

数据仓库模型的组成

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tL90WPCV-1637819772648)(C:/Users/yunqi/AppData/Roaming/Typora/typora-user-images/image-20211124114827923.png)]

组成

  1. 业务模型
  2. 领域模型
  3. 逻辑模型
  4. 物理模型

建立下面四个模型的好处

  1. 业务模型,主要解决业务层面的分解和程序化。
  2. 领域模型,主要对业务模型进行抽象处理,生成领域概念模型。
  3. 逻辑模型,主要将领域模型的概念实体以及实体之间的关系进行数据库层次的逻辑化。
  4. 物理模型,主要解决逻辑模型针对不同关系型数据库的物理化以及性能等一些具体的技术问题

为什么需要数据模型?

我们都知道,我们会用一个东西,肯定是它在某些方面,帮我们解决了问题,或者是优化了什么?那么数据模型到底可以为我们解决那些问题呢?有什么优点首先我们需要了解整个数据仓库的建设的发展史。

数据仓库的发展大致经历了三个过程

通过数据仓库建设的发展阶段,我们能够看出,数据仓库的建设和数据集市的建设的重要区别就在于数据模型的支持。因此,数据模型的建设,对于我们数据仓库的建设,有着决定性的意义

解释一下什么是数据集市?

数据集市是数据仓库里面的常见的概念描述之一

分类

应用场景

一般来说,数据模型的建设主要能够帮助我们解决以下的一些问题

数据仓库数据模型架构

最后引出什么是数据建模?

数据建模指的是对现实世界各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库

维度表的分类

事实表

维度表

SCD类型维度表行动对事实分析的影响
类型0属性值无变化事实与原始值相关联
类型1重写属性值事实与当前值相关联
类型2为新属性值增加新行事实与发送时的有效值关联
类型3增加新列来存储当前和原先值事实与当前和先前值关联
类型4增加对快速变化维的微型维度事实与有效的变化范围关联
类型5增加类型4和主维度表的类型1外键事实与有效的变化范围关联
类型6用类型3方法新增列,历史值用类型2处理,当前值用类型1处理事实与有效的变化范围,当前值关联
类型7增加储存最新值的维度表或视图事实与有效的变化范围,当前值关联

总结

1、事实表就是你要关注的内容;
2、维度表就是你观察该事务的角度,是从哪个角度去观察这个内容的。
例如,某地区商品的销量,是从地区这个角度观察商品销量的。事实表就是销量表,维度表就是地区表。

数据组织类型

维度模型按数据组织类型划分可分为星型模型、雪花模型、星座模型

星型模型

雪花模型

星座模型

怎么数据建模?

范式建模法(其实就说关系建模)

维度建模法

这里记住一个结论:关系模型对数据仓库是理想的基础,而星形模型对于数据集市是最佳的

实体建模法

实体建模认为任何业务都可以看成3个部分

举个例子:小明开车去学校上学,就以这个业务事实为例,我们可以把小明学校,看成是实体,上学描述的是一个业务过程,我们在这里可以抽象为一个具体“事件”,而“开车去”则可以看成是事件“上学”的一个说明。

由于实体建模法,能够很轻松的实现业务模型的划分,因此,在业务建模阶段和领域概念建模阶段,实体建模法有着广泛的应用。

缺点:由于实体说明法只是一种抽象客观世界的方法,因此,注定了该建模方法只能局限在业务建模和领域概念建模阶段。因此,到了逻辑建模阶段和物理建模阶段,则是范式建模和维度建模发挥长处的阶段。

标签:模型,数据仓库,建模,维度,数据,事实
来源: https://blog.csdn.net/qq_58732706/article/details/121536184