企业级分布式 HTAP 数据库管理系统 TBase
作者:互联网
TBase 是腾讯数据平台团队在开源的 PostgreSQL 基础上研发的企业级分布式 HTAP 数据库管理系统:
-
具备高性能可扩展的分布式事务能力,支持 RC 和 RR 两种隔离级别;
-
通过安全、管理、审计三权分立体系,提供全方位的数据安全保证机制;
-
支持高性能分区表,可使得数据检索效率成倍提升;
-
SQL 方面兼容 2003 标准、PostgreSQL 语法和常用 Oracle 函数&数据类型、窗口函数等;
-
提供大小商户数据分离、冷热数据分离等高效的数据治理能力
TBase 架构:
集群中有三种节点类型,各自承担不同的功能,通过网络连接成为一个系统。这三种节点类型分别是:
-
Coordinator:协调节点,对外提供接口,负责数据的分发和查询规划,多个节点位置对等,每个节点都提供相同的数据库视图,CN 存储系统的全局元数据。
-
Datanode:处理存储本节点相关的元数据,每个节点还存储数据的一个分片。在功能上,DN 节点负责完成执行协调节点分发的执行请求。
-
GTM: 全局事务管理器(Global transaction manager.),负责管理集群事务信息,同时管理集群的全局对象,比如序列,除此之外 GTM 上不提供其他的功能。
TBase 功能介绍:
-
分布式事务全局一致性能力:通过拥有自主专利的分布式事务一致性技术,包括两阶段提交(Two Phase Commit)以及全局时钟(Global Timestamp)的策略来保证在全分布式环境下的事务一致性。
-
SQL兼容能力:SQL2003 标准、PostgreSQL 语法、常用 Oracle 函数&数据类型、UDF/UDAF、常见窗口函数、JSON/JSONB/XML/数组等多种 NoSQL 类型 、递归 WITH、无锁 DDL 操作、扩展插件等。
-
HTAP能力:提供 OLTP 以及 OLAP 两个平面视角 ,OLTP 业务运行在 datanode 主节点上,OLAP 业务运行在 datanode 节点的备节点上,揭秘提升网站权重二者的数据同步采用流复制的方式来进行。
-
读写分离能力:提供了读写和只读两个平面视角,读写流量请求由主节点来处理,只读流量请求由备节点来处理,主备节点的数据同步采用流复制的方式来进行。
-
卓越的数据安全保障能力:通过三权分立的体系,将传统数据库系统 DBA 的角色分解为三个相互独立的角色:安全管理员、审计管理员、数据管理员;基于此提出安全策略,主要细分为三个部分:数据加密、数据脱敏访问、强制访问控制,三者组合提供多个层级的数据安全保障能力。
-
高效的数据治理能力:数据倾斜治理,用以解决数据分布不均带来的存储以及性能压力;冷热数据分级存储 ,用以降低业务的存储成本、提升热数据的性能。
-
多核并行计算能力:节点内部采用了并行计算,根据表大小同时启动多个进程来协同完成一个查询。
-
多租户能力:基于节点组 node group 的集群内多租户解决方案,做到数据库集群内部的业务和资源隔离,多个业务在TBase内部相互隔离的运行。
-
多级容灾能力:采用强同步复制来保证主从数据完全一致,保障主节点故障时数据无丢失;提供基于任意时间点的恢复特性来防止误操作带来的数据丢失。
-
在线扩容能力:通过引入shard map层(shard map 中每一项存储 shardid 和 DN 的 映射关系 ), 在新加节点时,只需要把一些 shard map 中的 shardid 映射到新加的节点,并把对应的数据搬迁过去就可以了,大大缩短扩容时间。
-
丰富的周边生态能力:PostGIS、异构数据复制、LVS 负载均衡、FDW 联邦能力等。
TBase 适用场景:
-
在国产化落地、业务核心领域去 O 场景;
-
对 HTAP 混合事务分析应用模型有需要的业务场景;
-
对物联网地理信息系统有需求的业务场景;
-
对实时高并发环境下的分布式事务强一致性有要求的业务(如金融、证券等业务)场景;
-
对企业级数据安全、审计、治理应用相关功能有需求的业务场景;
-
对高可用、异地容灾、7*24 小时服务能力有需求的业务场景;
-
有海量存储计算需求、弹性扩容、在线扩容需求的业务场景;
-
对异构数据互通共享有需求的业务场景。
标签:场景,TBase,能力,企业级,HTAP,数据,节点,分布式 来源: https://www.cnblogs.com/1994jinnan/p/11886468.html