首页 > 数据库> > 基于分布式关系型数据库，实现轻松应对百亿级数据分析场景解决方案

基于分布式关系型数据库，实现轻松应对百亿级数据分析场景解决方案

2019-08-16 12:55:42 作者：互联网

MyCat是什么？

从定义和分类来看，它是一个开源的分布式数据库系统，是一个实现了MySQL协议的服务器，前端用户可以把它看作是一个数据库代理，用MySQL客户端工具和命令行访问，而其后端可以用MySQL原生协议与多个MySQL服务器通信，也可以用JDBC协议与大多数主流数据库服务器通信，其核心功能是分表分库读写分离，即将一个大表水平分割为N个小表，存储在后端MySQL服务器里或者其他数据库里。也可以指定多个写库多个读库。

MyCat发展到目前的版本，已经不是一个单纯的MySQL代理了，它的后端可以支持MySQL、SQL Server、Oracle、DB2、PostgreSQL等主流数据库，也支持MongoDB这种新型NoSQL方式的存储，未来还会支持更多类型的存储。而在最终用户看来，无论是那种存储方式，在MyCat里，都是一个传统的数据库表，支持标准的SQL语句进行数据的操作，这样一来，对前端业务系统来说，可以大幅降低开发难度，提升开发速度。

MyCat可以干什么？

单纯的读写分离，此时配置最为简单，支持读写分离，主从切换

分表分库，对于超过 1000 万的表进行分片，最大支持 1000 亿的单表分片

多租户应用，每个应用一个库，但应用程序只连接 Mycat，从而不改造程序本身，实现多租户化

报表系统，借助于 Mycat 的分表能力，处理大规模报表的统计

替代 Hbase，分析大数据

作为海量数据实时查询的一种简单有效方案，比如 100 亿条频繁查询的记录需要在 3 秒内查询出来结果

MyCat分布式架构设计：
基于分布式关系型数据库，实现轻松应对百亿级数据分析场景解决方案

基于分布式关系型数据库，实现轻松应对百亿级数据分析场景方案
百亿级数据横向分片存储于数据分析架构

整体思路：

（1）利用mycat的分库分表规则，将百亿级数据横向分摊到不同的节点上；

（2）每个节点上实现一主多备，实现数据备份与读写分离；

（3）所有的写操作首先会在mycat中根据规则计算，路由到指定的节点上写操作；

（4）聚合查询mycat会分摊到各个节点上去计算之后，再基于节点的结果进行汇总处理；

（5）利用NBI大数据可视化分析工具与Mycat无缝连接；

（6）通过NBI大数据可视化分析工具（http://nbi.easydatavis.com:8033）提供的拖拽式分析，可以快速完成各类分析报告和百亿级数据，秒级响应的用户体验。

标签：数据分析,百亿,数据库,MyCat,MySQL,分表,节点,分布式
来源： https://blog.51cto.com/14465598/2430052