《大数据的一个重要方面:数据可用性》笔记
作者:互联网
1.大数据可用性的概念、挑战和研究问题
1.1 大数据可用性的基本概念
- 一致性
- 精确性
- 完整性:数据集合中包含足够的数据来回答各种查询和支持各种计算
- 时效性
- 实体同一性:同一实体在各种数据源中的描述统一
1.2 大数据可用性的挑战和研究问题
- 高质量大数据获取与整合的理论和技术
- 完整的大数据可用性理论体系
- 数据错误自动检测与修复的理论和技术
- 弱可用数据上近似计算的理论和技术
弱可用数据:数据中的错误不能彻底修复
- 弱可用数据上的知识发掘与演化的机理
2.数据可用性的研究进展
2.1 高质量大数据获取与整合
大数据的主要来源:
1. 分布在Web上的丰富数据库资源
2. 物理信息系统,如智能电网、智慧城市等
3. 科学实验与观测数据
标签:修复,可用,理论,可用性,高质量,笔记,数据 来源: https://www.cnblogs.com/easternE/p/15978127.html