其他分享
首页 > 其他分享> > 《大数据的一个重要方面:数据可用性》笔记

《大数据的一个重要方面:数据可用性》笔记

作者:互联网

1.大数据可用性的概念、挑战和研究问题

1.1 大数据可用性的基本概念

  1. 一致性
  2. 精确性
  3. 完整性:数据集合中包含足够的数据来回答各种查询和支持各种计算
  4. 时效性
  5. 实体同一性:同一实体在各种数据源中的描述统一

1.2 大数据可用性的挑战和研究问题

  1. 高质量大数据获取与整合的理论和技术
  2. 完整的大数据可用性理论体系
  3. 数据错误自动检测与修复的理论和技术
  4. 弱可用数据上近似计算的理论和技术

弱可用数据:数据中的错误不能彻底修复

  1. 弱可用数据上的知识发掘与演化的机理

2.数据可用性的研究进展

2.1 高质量大数据获取与整合

大数据的主要来源:
  1. 分布在Web上的丰富数据库资源
  2. 物理信息系统,如智能电网、智慧城市等
  3. 科学实验与观测数据

标签:修复,可用,理论,可用性,高质量,笔记,数据
来源: https://www.cnblogs.com/easternE/p/15978127.html