高级管理人员信息系统和数据仓库以及外部数据/非结构化数据与数据仓库
作者:互联网
内容目录
高级管理人员信息系统和数据仓库以及外部数据/非结构化数据与数据仓库
一、高级管理人员信息系统和数据仓库
EIS-高级管理人员信息系统-计算机饿最有效形式之一。
EIS处理,处于帮助高级管理人员制定决策的目的而设计的。比较典型的用途:
- 趋势分析和发现
- 关键比例指示器度量和跟踪
- 向下探察分析
- 问题监控
- 竞争分析
向下探察数据是指从一个汇总数据开始,将该汇总数据逐次地分解成一组更细致的汇总数据。
向下探察数据怎么实现变成了问题,所以生成用于向下探察分析的基本数据是成功地完成向下探察处理的主要障碍。
数据仓库运行在EIS坏境中。可以理解为,数据仓库是根据EIS分析员的需要制定的。所以建成数仓之后,EIS的工作比没有数仓时就简单多了
为什么简单?因为:
- 不必搜索限定的数据源
- 不必从现存系统中生成特定的抽取程序
- 不必担心非集成的数据
- 不必担心细节数据和汇总数据及两者之间的连接
- 不必担心寻找合适的数据时基
- 有大量的汇总数据可用
在数仓的不同层次,在整个的汇总过程中,数据通过一个键码结构建成关联。键码结构本身或者键码结构衍生出来的结构将各层数据联系起来,以便能够方便地向下探察分析
EIS和数仓之间有着密切的联系。数仓显然是支持EIS的所有需求的。有了数仓,就是的EIS的分析方便了许多
数仓在EIS的作用:
- 十分快捷信息的管理需要
- 转变其思路的需要
- 观察集成数据的管理需要
- 观察时间范围内数据的管理需要
- 进行向下探察的管理需要
二、外部数据/非结构化数据与数据仓库
数仓数据的来源可以分为两种,内部数据和外部数据
- 内部数据:以现有系统为来源的数据,可以看作是企业的内部数据,从现有系统抽取的数据称为内部结构化数据
- 外部数据:并非产生与企业本身系统,称作外部数据,通常这些数据以非结构化的、不可预测的格式进入企业的
数仓是存储外部和非结构化数据的理想场所
外部数据的待解决问题:
- 非结构化问题的可用频率。外部数据是没有呈现的真正的模式。为了确保这些数据正确,就必须建立永久的监控方式。
- 数据的形式。外部数据是完全没有规则的。为了使之有用并能放入数仓,就必须对外部数据进行一定的重新格式化。(将其转换为内部可接受的有用的形式。可以想象一下业务逻辑中的ETL清洗)
- 不可预测性。外部数据的来源不可预测,进入数仓的时间也不可预测
非结构化数据的两种比较常见的类型就是图像和声音。
元数据和外部数据
可以通过元数据,使用者可以判断许多有关外部数据的信息。甚至可以通过元数据信息来判断源文件的数据类型
存储外部数据/非结构化数据
如果资源和经济允许,外部数据完全存储在数据仓库中。但是大多数情况下,将所有的外部数据存储在数据仓库中是不太现实的。
在数据仓库的元数据中,对外部数据/非结构化数据进行登录,创建一个条目以说明什么地方能够找到外部数据本身,外部数据存储在任何一个方便的地方。外部数据可能存放在文件柜中、胶片、磁带等等
外部数据归档
数据都有自己的生命周期。一旦超过了这个生命周期,就要考虑结束这些数据的问题。是丢弃还是归档,需要仔细的分析。通常,外部数据可能从数仓移到一些便宜的存储设备。元数据对外部数据的饮用应该更新以反映新的存储位置,并且新的存储位置仍然保留在原数据存储单元中。
总结:数仓不仅有内部结构化的数据,还拥有许多外部的数据源,就是外部非结构化数据。外部数据来源是多样性的,而且外部数据不一定存在数据仓库中。
标签:数仓,结构化,外部,数据仓库,EIS,数据 来源: https://blog.csdn.net/weixin_46429290/article/details/123187504