news 2026/4/16 12:33:18

分库分表核心原理揭秘

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
分库分表核心原理揭秘

分库分表本质就是在一次 SQL 执行前,动态决定:

  • 哪个数据库连接(DataSource)

  • 哪张真实表(table_xx)

MyBatis / MyBatis-Plus 本身并不具备分库分表能力,真正做到“动态切换”的,是拦截器 + 路由规则 + ThreadLocal 上下文

在 SQL 真正发送到数据库之前,通过拦截器计算路由规则,动态替换 DataSource 和表名。

ORM 框架

https://gitee.com/laomaodu/orm-framework

分库

分库并不是运行时创建数据库连接,而是系统启动时初始化多个 DataSource,执行 SQL 时通过 AbstractRoutingDataSource 根据 ThreadLocal 中的路由 key 动态选择目标 DataSource,从对应的连接池中获取连接。

1️⃣ 多数据源准备(前提)

spring:
datasource:
db0: ...
db1: ...
db2: ...

系统启动时:

  • 所有 DataSource 都初始化

  • 放入一个 Map 中

Map<String, DataSource> dataSourceMap;

public class DynamicDataSource extends AbstractRoutingDataSource { @Override protected Object determineCurrentLookupKey() { return DataSourceContext.get(); } }
  • 每次 SQL 执行前

  • Spring 会调用determineCurrentLookupKey()

  • 返回值决定使用哪个 DataSource

ThreadLocal 保存“当前库”

public class DataSourceContext { private static final ThreadLocal<String> HOLDER = new ThreadLocal<>(); public static void set(String dbKey) { HOLDER.set(dbKey); } public static String get() { return HOLDER.get(); } }

4️⃣ 在执行前设置库

String dbKey = "db" + (userId % 2);
DataSourceContext.set(dbKey);

@Bean public DataSource dataSource() { Map<Object, Object> targetDataSources = new HashMap<>(); targetDataSources.put("db0", dataSource0()); targetDataSources.put("db1", dataSource1()); DynamicDataSource ds = new DynamicDataSource(); ds.setDefaultTargetDataSource(dataSource0()); ds.setTargetDataSources(targetDataSources); return ds; }
public class DynamicDataSource extends AbstractRoutingDataSource { @Override protected Object determineCurrentLookupKey() { return DataSourceContext.get(); } } public class DataSourceContext { private static final ThreadLocal<String> HOLDER = new ThreadLocal<>(); public static void set(String key) { HOLDER.set(key); } public static String get() { return HOLDER.get(); } public static void clear() { HOLDER.remove(); } }
// 2. 分库规则 String dbKey = "db" + (userId % 2); DataSourceContext.set(dbKey);
MyBatis ↓ DynamicDataSource.getConnection() ↓ determineCurrentLookupKey() ↓ DataSourceContext.get() → "db1" ↓ targetDataSources.get("db1") ↓ db1DataSource.getConnection() ↓ 从 db1 的连接池拿 Connection

分表

分表是如何“动态切换表名”的

select * from order where id = ?

MyBatis 最终会生成BoundSql

String sql = boundSql.getSql();

@Intercepts({ @Signature( type = Executor.class, method = "query", args = {MappedStatement.class, Object.class, RowBounds.class, ResultHandler.class} ) }) public class ShardingInterceptor implements Interceptor { }
long userId = getUserId(param); String table = "order_" + (userId % 16);
///方法2 SQLParser.parse(sql).replaceTable();

完整一次执行流程(串起来)

1. Mapper 方法调用 2. 分库分表拦截器触发 3. 从参数中取分片键(userId / orderId) 4. 计算: - dbKey = userId % 2 - table = order_ (userId % 16) 5. ThreadLocal 设置 dbKey 6. SQL 中 order → order_xx 7. Executor 使用正确 DataSource 8. JDBC 执行最终 SQL

为什么必须用 ThreadLocal

  • 一个请求 = 一个线程

  • 同一线程内:

    • 多次 SQL

    • 必须走同一个库

  • ThreadLocal:

    • 无侵入

    • 自动隔离

👉这是分库分表的线程级上下文基础

ShardingSphere

  • 它内置了事务传播和多数据源管理。

  • 手动实现容易错。

ShardingSphere JDBC 本质上是一个增强版 DataSource,在 SQL 执行前通过解析 SQL 和分片算法计算路由结果,动态选择目标数据源并重写 SQL,这与手写 AbstractRoutingDataSource 的原理完全一致,只是做了工程级封装。

MyBatis

ShardingSphereDataSource ←(等价于你的 DynamicDataSource)

真实 DataSource(db0 / db1)

MySQL

刚刚手写的ShardingSphere 对应
DynamicDataSourceShardingSphereDataSource
ThreadLocalSQL Hint / 内部上下文
分库算法ShardingAlgorithm
SQL replaceSQL Rewrite Engine

<dependency>
<groupId>org.apache.shardingsphere</groupId>
<artifactId>shardingsphere-jdbc-core-spring-boot-starter</artifactId>
<version>5.5.0</version>
</dependency>
⚠️ 不要再引 dynamic-datasource

数据库

ds0.order_0
ds0.order_1

ds1.order_0
ds1.order_1

  1. datasource→ 配置所有物理库(分库)

  2. actual-data-nodes→ 分库分表映射关系,逻辑表对应哪些物理表

  3. database-strategy→ 分库规则

  4. table-strategy→ 分表规则

  5. sharding-algorithms→ 定义具体的分库/分表算法表达式

  6. sql-show→ 打印 SQL,观察路由结果

spring: shardingsphere: # -------------------------- # 数据源配置(分库用) # -------------------------- datasource: # 定义所有的数据源名称,用逗号分隔 names: ds0, ds1 # 数据源 ds0 的具体配置 ds0: type: com.zaxxer.hikari.HikariDataSource # 使用 HikariCP 连接池 jdbc-url: jdbc:mysql://localhost:3306/db0 # 连接的数据库地址 username: root # 数据库用户名 password: 123456 # 数据库密码 # 数据源 ds1 的具体配置 ds1: type: com.zaxxer.hikari.HikariDataSource jdbc-url: jdbc:mysql://localhost:3306/db1 username: root password: 123456 # -------------------------- # 分片规则(分库分表策略) # -------------------------- rules: sharding: # 配置具体的分表对象 tables: order: # 表名逻辑名 # 实际物理表的数据源与表名 # ds$->{0..1} -> ds0, ds1 # order_$->{0..1} -> order_0, order_1 actual-data-nodes: ds$->{0..1}.order_$->{0..1} # 分库策略 database-strategy: standard: sharding-column: user_id # 根据哪个字段决定分库 sharding-algorithm-name: db-inline # 使用的分库算法 # 分表策略 table-strategy: standard: sharding-column: user_id sharding-algorithm-name: table-inline # 使用的分表算法 # -------------------------- # 分库和分表算法定义 # -------------------------- sharding-algorithms: # 分库算法 db-inline: type: INLINE # 内联表达式算法 props: algorithm-expression: ds${user_id % 2} # 例如 user_id=3 -> 3%2=1 -> 使用 ds1 数据源 # 分表算法 table-inline: type: INLINE props: algorithm-expression: order_${user_id % 2} # 例如 user_id=3 -> 3%2=1 -> 使用 order_1 表 # -------------------------- # ShardingSphere 全局配置 # -------------------------- props: sql-show: true # 打印最终执行的 SQL,方便调试和验证分库分表是否生效

dbKey = "db" + userId % 2; -》algorithm-expression: ds${user_id % 2}

table = "order_" + userId % 2;-》algorithm-expression: order_${user_id % 2}

ShardingSphere

  • 内部 SQL 路由引擎

  • 自动选择 ds0 / ds1

  • AST 级 SQL Rewrite

  • 支持 join / 子查询

@Select("select * from order where user_id = #{userId}")
Order select(@Param("userId") Long userId);

ShardingSphere 实际执行: select * from order_1 where user_id = ? -- DataSource = ds1
场景结论
单表百万级不需要
分表但不分库可选
分库 + 分表必须
分库 + 事务必须
多表 join必须
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/10 14:34:19

零基础用IndexTTS 2.0做配音:上传5秒录音,一键生成自然语音

零基础用IndexTTS 2.0做配音&#xff1a;上传5秒录音&#xff0c;一键生成自然语音 你有没有过这样的经历&#xff1f;剪完一条30秒的vlog&#xff0c;卡在配音环节整整两小时——找外包要等三天&#xff0c;自己录又总带杂音&#xff0c;换几个TTS工具试下来&#xff0c;不是…

作者头像 李华
网站建设 2026/4/16 11:10:01

QListView自定义排序逻辑项目应用解析

以下是对您提供的技术博文进行 深度润色与专业重构后的版本 。我以一位有十年Qt工业UI开发经验的工程师视角,彻底摒弃模板化表达、AI腔调和教科书式结构,转而采用 真实项目中的思考脉络 + 现场调试口吻 + 工程权衡细节 来重写全文。语言更紧凑、逻辑更锋利、案例更扎心,…

作者头像 李华
网站建设 2026/4/14 22:15:04

无需专业技能!用Qwen-Image-Edit-2511轻松完成品牌换装

无需专业技能&#xff01;用Qwen-Image-Edit-2511轻松完成品牌换装 你有没有过这样的时刻&#xff1a;市场部凌晨发来消息&#xff0c;“新版VI即刻启用&#xff0c;所有渠道主图LOGO、配色、标语必须两小时内全部替换完毕”&#xff1b;而你打开PS&#xff0c;发现上百张产品…

作者头像 李华
网站建设 2026/4/15 13:38:16

VibeVoice Pro实操手册:pkill进程管理与服务热重启标准化操作

VibeVoice Pro实操手册&#xff1a;pkill进程管理与服务热重启标准化操作 1. 为什么需要掌握pkill与热重启——从“声音卡顿”说起 你有没有遇到过这样的情况&#xff1a;正在用VibeVoice Pro给客户做实时语音播报&#xff0c;突然声音停了三秒&#xff0c;再恢复时已经错过关…

作者头像 李华
网站建设 2026/4/11 16:12:28

升级我的AI工具箱:集成阿里万物识别后效率翻倍

升级我的AI工具箱&#xff1a;集成阿里万物识别后效率翻倍 1. 为什么我需要这个“看得懂中文”的图片识别工具 上周我还在为电商客户处理200张商品图发愁——每张都要手动标注“玻璃花瓶”“北欧风”“磨砂质感”“客厅装饰”这些关键词&#xff0c;光是写描述就花了三小时。…

作者头像 李华