首页 > TAG信息列表 > 数据系统

DDIA读书笔记(一)——数据系统基础

1.1 可靠、可扩展与可维护的应用系统 数据密集型应用通常包含了这几个模块:数据库、高速缓存、索引、流式处理以及批处理。 1.1.1 认识数据系统 大多数软件系统都极为关注3个问题: 可靠性(reliability):出现意外(软硬件故障和人为失误)时仍然能够正常运转(功能正确,性能可能会降低)。 可扩

大数据系统资源管理YARN

Yarn系统原理     Yarn主要就是将JobTracker的两个主要功能分离成单独的组件:资源管理、任务调度/监控 RM,ResourceManager,全局管理 NM,NodeManager,节点管理 AM,ApplicationMaster,单个应用管理 Container,单个任务的资源管理 RM负责分配NM给AM,AM负责把任务发送到NM,每个任务在NM中以C

数据系统提供商极道科技加入龙蜥社区

近日,极道科技(北京)有限公司(以下简称“极道科技”)签署了 CLA(ContributionLicense Agreement,贡献者许可协议),正式加入龙蜥社区(OpenAnolis)。 极道科技成立于 2015 年,旨在帮助企业把数据转变成真正的数据资产,并创新地提出了“存(企业级分布式存储系统)、管(强关联的智能数据管理系统)、算(

数据系统的可靠性,可伸缩性,可维护性

数据密集型应用设计读书笔记第一章。 现在的数据密集型应用,趋势是组件化。 存储数据,以便自己或其他应用程序之后能再次找到 (数据库(database)) 记住开销昂贵操作的结果,加快读取速度(缓存(cache)) 允许用户按关键字搜索数据,或以各种方式对数据进行过滤(搜索索引(search indexes)) 向其

数据系统的事务

数据密集型应用设计读书笔记第七章 事务可以解决很多数据系统半路故障导致的各种问题。 事务是一个抽象层,允许应用程序假装某些并发问题和某些类型的硬件和软件故障不存在。各式各样的错误被简化为一种简单情况:事务中止(transaction abort),而应用需要的仅仅是重试。 从概念上讲,事务

无语子,GitHub首次开源,在国内外都被称为分布式理论+实践的巅峰之作

前言 如果你是一位软件行业从业者,尤其是从事服务器端或者后台系统软件开发,相信近年来一定被层出不穷的商业名词所包围:NoSQL、Big Data、Web-scale、Sharding.Eventual consistency、ACID、CAP理论、云服务、MapReduce和Real-time等,所有这些其实都围绕着如何构建高效存储与数据

刚哥谈架构(七)- 大数据系统的文件存储

上一次我们谈到了各种类型的数据库,今天我们来谈谈在大数据,尤其是Hadoop栈下的数据和文件的存储。 我们知道为了解决大数据的存储和处理问题,google最先设计了推出了Map/Reduce的算法,而hadoop就是Google的map/reduce的开源实现。Hadoop主要由分布式的文件系统HDFS(参考Google的GFS)和M

saltstack的配置管理与数据系统

YAML语言 YAML是一种直观的能够被电脑识别的数据序列化格式,是一个可读性高并且容易被人类阅读,容易和脚本语言交互,用来表达资料序列的编程语言。 它类似于标准通用标记语言的子集XML的数据描述语言,语法比XML简单很多。 YAML语言的格式如下: house: family: name: Doe

第二部分-分布式数据系统

第五章 数据复制 第六章 数据分区 6.1 数据分区与数据复制 可以组合使用主从复制模型和分区,分区拓展单机性能,主从模型中从节点作为容灾备份。 每个分区节点,既包含主副本,又包含从副本,副本可以隶属于不同分区。 6.2 键值数据的分区 如果分区不均匀,某些分区节点会承担更多的数据量或

大数据分析系统包含哪些功能板块

  大数据系统应包含以下功能模块:多数据源获取数据模块;数据预处理模块(清洗、验证等),数据存储模块,数据处理模块、数据分析模块等(预测分析、生成使用建议等),呈现和可视化的总结、汇总模块。   一、多数据源获取   大数据系统是生态系统,需要对各种不同种类来源的数据进行分

saltstack 数据系统!!!

saltstack 数据系统 SaltStack有两大数据系统,分别是: GrainsPillar SaltStack数据系统组件 Grains Grains是SaltStack的一个组件,其存放着minion启动时收集到的信息。 Grains是SaltStack组件中非常重要的组件之一,因为我们在做配置部署的过程中会经常使用它,Grains是SaltSta

SaltStack数据系统

SaltStack数据系统 SaltStack有两大数据系统,分别是: GrainsPillar SaltStack数据系统的组件 SaltStack组件之Grains Grains是SaltStack的一个组件,其存放着minion启动时收集到的信息。 Grains是SaltStack组件中非常重要的组件之一,因为我们在做配置部署的过程中会经常使用它,Grai

SaltStack之数据系统

SaltStack之数据系统 SaltStack数据系统SaltStack数据系统组件 2.1 SaltStack组件之Grains 2.2 SaltStack组件之Pillar 2.3 Grains与Pillar的区别SaltStack数据系统 SaltStack有两大数据系统,分别是: Grains Pillar 2. SaltStack数据系统组件 2.1 SaltStack组件之Grains Grains

大数据分析 实验项目一 大数据系统应用开发思路及环境

本教程将指引读者在Windows操作系统下使用开源虚拟机软件VMware Workstation Pro安装Ubuntu。本教程是基于 林子雨编著《大数据技术原理与应用》教材的。 一、材料和工具 1. 安装好的VMware Workstation虚拟机软件 请自行网络搜索,下载并安装完成,这里不做赘述。   2. 下载Ubuntu桌

数栈技术大牛分享:云原生大数据系统架构的实践和思考

ArchSummit2021年全球架构师峰会于4月25日-26日在上海举办,袋鼠云运维开发技术专家沙章利(花名:浣熊)应邀出席此次峰会,并在4月26日下午的《弹性架构实践》专题会场上为大家带来《弹性云原生大数据系统架构实践》的演讲。本次演讲主要介绍袋鼠云基于数栈、结合数年大数据基础设施建设经

数栈技术大牛分享:云原生大数据系统架构的实践和思考

ArchSummit2021年全球架构师峰会于4月25日-26日在上海举办,袋鼠云运维开发技术专家沙章利(花名:浣熊)应邀出席此次峰会,并在4月26日下午的《弹性架构实践》专题会场上为大家带来《弹性云原生大数据系统架构实践》的演讲。本次演讲主要介绍袋鼠云基于数栈、结合数年大数据基础设施建设经

ArchSummit2021年全球架构师峰会将于4月25号-26号在上海举办,袋鼠云数栈技术专家受邀

一、大会介绍ArchSummit全球架构师峰会是极客邦科技旗下InfoQ中国团队推出的重点面向高端技术管理者、架构师的技术会议,54%参会者拥有8年以上工作经验。会议聚焦业界强大的技术成果,秉承“实践第一、案例为主”的原则,展示先进技术在行业中的典型实践,以及技术在企业转型、发展中的推

想学大数据开发?

说数据是一个企业最核心的东西之一,我想大家应该都能基本认同吧,毕竟连XXX都说过,这是一个数据为王的时代,谁掌握了数据谁就掌握未来! 怪不得咱这里的小伙伴们个个都磨拳擦掌,都嚷嚷着想从事大数据相关的开发工作,问能不能整一个大数据开发相关的技术学习路线和知识点大梳理。 得嘞,你

《数据密集型应用系统设计》读书笔记——第二部分 分布式数据系统(二)

第8章 分布式系统的挑战 故障与部分失效 当你在⼀台计算机上编写一个程序时,它通常会以一种确定的方式运⾏:⽆论是⼯作还是不工作。充满错误的软件可能会让人觉得电脑有时候是“糟糕的一天”(这个问题通常是重新启动的问题), 但这主要是软件写得不好的结果。 单个计算机上的软件没有

《数据密集型应用系统设计》读书笔记——第二部分 分布式数据系统

第二部分 分布式数据系统 前面我们讨论了数据系统的各个⽅方⾯面,但仅限于数据存储在单台机器上的情况。现在我们到了第二部分,进⼊更高的层次,并提出⼀个问题:如果多台机器参与数据的存储和检索,会发⽣什么? 你可能会出于各种各样的原因,希望将数据库分布到多台机器上: 可扩展性   如果你的

《数据密集型应用系统设计》读书笔记——第一部分 数据系统基础

第一部分 数据系统基础 第1章 可靠、可扩展与可维护的应用系统 当今许多新型应用都属于数据密集型,而不是计算密集型。对于这些类型应用,CPU的处理能力往往不是第一限制性因素,关键在于数据量、数据的复杂度以及数据的快速和多变性。 数据密集型应用系统设计也是基于标准模块构

什么是大数据,为什么如此重要?

大数据是组织收集的结构化、半结构化和非结构化数据的组合,这些数据可以用于信息挖掘,并用于机器学习项目、预测建模和其他高级分析应用。 处理和存储大数据的系统已经成为组织中数据管理体系结构的一个共同组成部分。 大数据的特点往往是3V:Volume(海量),Velocity(速度),Variety

数据仓库简单认知

数据仓库 1.数据仓库(Data Warehouse): ​ 是一个面向主题的、集成的、相对稳定的、且随时间变化的数据集合,用于支持管理决策。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。数据仓库中的数据是在对原有分散的数据

设计数据密集型应用

该书大约是2017年翻译的,全书392页,分为三部分,一共12章。 这是一本理论结合实践的书。 本书为数据系统的设计、实现、评价提供了很好的概念框架。 目录如下: 序⾔言 第一部分:数据系统的基⽯石 第一章:可靠性、可扩展性、可维护性 第二章:数据模型与查询语⾔言 第三章:存储与检索 第四章

[游戏开发设计]浅谈游戏开发数据系统设计(一)

原文链接:http://www.cnblogs.com/lovepurple/p/3579016.html   最近在参与Unity游戏的客户端开发,总结下整理游戏数据系统的构建及简单的设计。   客户端采用C#进行开发,C#托管语言在一定程度上大大减轻了程序员关于内存分配释放的问题。   整个客户