其他分享
首页 > 其他分享> > 分库分表——基本概念以及shardingJdbc和Mycat对比

分库分表——基本概念以及shardingJdbc和Mycat对比

作者:互联网

1、什么是分库分表

2、为什么分库分表

3、分库分表的实施策略

4、分库分表常用的原理策略

在这里插入图片描述

4.1 Mycat

概括

基础介绍:

  1. 一个彻底开源的,面向企业应用开发的大数据库集群

  2. 支持事务、ACID、可以替代MySQL的加强版数据库

  3. 一个可以视为MySQL集群的企业级数据库,用来替代昂贵的Oracle集群

  4. 一个融合内存缓存技术、NoSQL技术、HDFS大数据的新型SQL Server

  5. 结合传统数据库和新型分布式数据仓库的新一代企业级数据库产品

  6. 一个新颖的数据库中间件产品

优点:

缺点:

MyCat经典实用场景

结构

在这里插入图片描述

我们需要了解一点,集中式的Proxy其实现非常复杂,这要从MySQL处理SQL语句的原理说起,因为不是本文要论述的重点,因此只是简单的提及几点:

只要有解析的过程,其性能损耗就是比较可观的,我们也可以认为这是一种重量级的解决方案。

4.2 ShardingJdbc

ShardingJdbc概括

基础介绍

  1. 适用于任何基于JDBC的ORM框架,如:JPA, Hibernate, Mybatis, Spring JDBC Template或直接使用JDBC。

  2. 支持任何第三方的数据库连接池,如:DBCP, C3P0, BoneCP, Druid, HikariCP等。

  3. 支持任意实现JDBC规范的数据库。目前支持MySQL,Oracle,SQLServer,PostgreSQL以及任何遵循SQL92标准的数据库。

优点:

  1. 性能很好的
  2. 支持跨数据库jdbc

缺点:

  1. 增加了开发难度
  2. 不支持跨语言(java)

ShardingJdbc是ShardingSphere中关于jdbc增强方式的一种,而且ShardingSphere已经孵化为apache顶级项目

每一个服务都持有一个Sharing-JDBC,这个JDBC以Jar包的形式提供,基本上可以认为是一个增强版的jdbc驱动,需要一些分库分表的配置,业务开发人员不需要去对代码进行任何的修改。可以很轻松的移植到SpringBoot,ORM等框架上

但是这个结构也不是完美的,每一个服务持有一个proxy意味着会在MySQL服务端新建大量的连接,维持连接会增加MySQL服务器的负载,虽然这种负载提升一般无法察觉。

框架结构

shardingjdbc中涉及到基础概念

逻辑表、真实表、数据节点——每张真实表

  1. 逻辑表
    即水平拆分的表的总称。比如订单业务会被拆分成t_order0,t_order1两张表,但是他们同属于一个逻辑表:t_order

  2. 绑定表
    分片规则一直的主表和子表。比如还是上面的t_order表,其分片键是order_id,其子表t_order_item的分片键也是order_id。在规则配置时将两个表配置成绑定关系,就不会在查询时出现笛卡尔积。

  3. 广播表
    有一些表是没有分片的必要的,比如省份信息表,全国也就30多条数据,这种表在每一个节点上都是一样的,这种表叫做广播表。

在这里插入图片描述

5、关于分表策略通常分为三种

  1. 取模

  2. 范围分表-通常是时间

  3. 城市-有明显业务特征的分表

时间范围策略通常用于冷热数据分离,例如美团限查近3个月的订单,量体比较大,而且历史数据使用相对较少

城市这种分表策略,类似于多租户的概念,业务处理场景一样,但是数据独立

6、总结

本文主要是简单介绍下什么是分库分表,分库分表的实施策略,以及分库分表通用原理。研究这些内容,主要是公司业务数据增长速度过快,单表数据过于庞大,而且如果只做冷热数据分离不够友好,而且不能解决目前业务的发展问题,打算利用分表来实现,而且结合自身业务以及两种框架原理,本着符合业务场景,可靠度高,接入成本低,具有良好的文档,活跃的社区的原则,打算采用shardingJdbc,涉及到分表策略选择使用城市的维度。

标签:分库,数据库,Mycat,JDBC,分片,分表,shardingJdbc,数据
来源: https://blog.csdn.net/yanyuan_1118/article/details/118354289