分库分表本质就是在一次 SQL 执行前,动态决定:
用哪个数据库连接(DataSource)
用哪张真实表(table_xx)
而MyBatis / MyBatis-Plus 本身并不具备分库分表能力,真正做到“动态切换”的,是拦截器 + 路由规则 + ThreadLocal 上下文。
在 SQL 真正发送到数据库之前,通过拦截器计算路由规则,动态替换 DataSource 和表名。
ORM 框架![]()
https://gitee.com/laomaodu/orm-framework
分库
分库并不是运行时创建数据库连接,而是系统启动时初始化多个 DataSource,执行 SQL 时通过 AbstractRoutingDataSource 根据 ThreadLocal 中的路由 key 动态选择目标 DataSource,从对应的连接池中获取连接。
1️⃣ 多数据源准备(前提)
spring:
datasource:
db0: ...
db1: ...
db2: ...
系统启动时:
所有 DataSource 都初始化
放入一个 Map 中
Map<String, DataSource> dataSourceMap;
public class DynamicDataSource extends AbstractRoutingDataSource { @Override protected Object determineCurrentLookupKey() { return DataSourceContext.get(); } }每次 SQL 执行前
Spring 会调用
determineCurrentLookupKey()返回值决定使用哪个 DataSource
ThreadLocal 保存“当前库”
public class DataSourceContext { private static final ThreadLocal<String> HOLDER = new ThreadLocal<>(); public static void set(String dbKey) { HOLDER.set(dbKey); } public static String get() { return HOLDER.get(); } }4️⃣ 在执行前设置库
String dbKey = "db" + (userId % 2);
DataSourceContext.set(dbKey);
@Bean public DataSource dataSource() { Map<Object, Object> targetDataSources = new HashMap<>(); targetDataSources.put("db0", dataSource0()); targetDataSources.put("db1", dataSource1()); DynamicDataSource ds = new DynamicDataSource(); ds.setDefaultTargetDataSource(dataSource0()); ds.setTargetDataSources(targetDataSources); return ds; }public class DynamicDataSource extends AbstractRoutingDataSource { @Override protected Object determineCurrentLookupKey() { return DataSourceContext.get(); } } public class DataSourceContext { private static final ThreadLocal<String> HOLDER = new ThreadLocal<>(); public static void set(String key) { HOLDER.set(key); } public static String get() { return HOLDER.get(); } public static void clear() { HOLDER.remove(); } }// 2. 分库规则 String dbKey = "db" + (userId % 2); DataSourceContext.set(dbKey);MyBatis ↓ DynamicDataSource.getConnection() ↓ determineCurrentLookupKey() ↓ DataSourceContext.get() → "db1" ↓ targetDataSources.get("db1") ↓ db1DataSource.getConnection() ↓ 从 db1 的连接池拿 Connection分表
分表是如何“动态切换表名”的
select * from order where id = ?
MyBatis 最终会生成BoundSql:
String sql = boundSql.getSql();
@Intercepts({ @Signature( type = Executor.class, method = "query", args = {MappedStatement.class, Object.class, RowBounds.class, ResultHandler.class} ) }) public class ShardingInterceptor implements Interceptor { }long userId = getUserId(param); String table = "order_" + (userId % 16);///方法2 SQLParser.parse(sql).replaceTable();完整一次执行流程(串起来)
1. Mapper 方法调用 2. 分库分表拦截器触发 3. 从参数中取分片键(userId / orderId) 4. 计算: - dbKey = userId % 2 - table = order_ (userId % 16) 5. ThreadLocal 设置 dbKey 6. SQL 中 order → order_xx 7. Executor 使用正确 DataSource 8. JDBC 执行最终 SQL为什么必须用 ThreadLocal
一个请求 = 一个线程
同一线程内:
多次 SQL
必须走同一个库
ThreadLocal:
无侵入
自动隔离
👉这是分库分表的线程级上下文基础
ShardingSphere
它内置了事务传播和多数据源管理。
手动实现容易错。
ShardingSphere JDBC 本质上是一个增强版 DataSource,在 SQL 执行前通过解析 SQL 和分片算法计算路由结果,动态选择目标数据源并重写 SQL,这与手写 AbstractRoutingDataSource 的原理完全一致,只是做了工程级封装。
MyBatis
↓
ShardingSphereDataSource ←(等价于你的 DynamicDataSource)
↓
真实 DataSource(db0 / db1)
↓
MySQL
| 刚刚手写的 | ShardingSphere 对应 |
|---|---|
| DynamicDataSource | ShardingSphereDataSource |
| ThreadLocal | SQL Hint / 内部上下文 |
| 分库算法 | ShardingAlgorithm |
| SQL replace | SQL Rewrite Engine |
<dependency>
<groupId>org.apache.shardingsphere</groupId>
<artifactId>shardingsphere-jdbc-core-spring-boot-starter</artifactId>
<version>5.5.0</version>
</dependency>
⚠️ 不要再引 dynamic-datasource
数据库
ds0.order_0
ds0.order_1
ds1.order_0
ds1.order_1
datasource→ 配置所有物理库(分库)
actual-data-nodes→ 分库分表映射关系,逻辑表对应哪些物理表
database-strategy→ 分库规则
table-strategy→ 分表规则
sharding-algorithms→ 定义具体的分库/分表算法表达式
sql-show→ 打印 SQL,观察路由结果
spring: shardingsphere: # -------------------------- # 数据源配置(分库用) # -------------------------- datasource: # 定义所有的数据源名称,用逗号分隔 names: ds0, ds1 # 数据源 ds0 的具体配置 ds0: type: com.zaxxer.hikari.HikariDataSource # 使用 HikariCP 连接池 jdbc-url: jdbc:mysql://localhost:3306/db0 # 连接的数据库地址 username: root # 数据库用户名 password: 123456 # 数据库密码 # 数据源 ds1 的具体配置 ds1: type: com.zaxxer.hikari.HikariDataSource jdbc-url: jdbc:mysql://localhost:3306/db1 username: root password: 123456 # -------------------------- # 分片规则(分库分表策略) # -------------------------- rules: sharding: # 配置具体的分表对象 tables: order: # 表名逻辑名 # 实际物理表的数据源与表名 # ds$->{0..1} -> ds0, ds1 # order_$->{0..1} -> order_0, order_1 actual-data-nodes: ds$->{0..1}.order_$->{0..1} # 分库策略 database-strategy: standard: sharding-column: user_id # 根据哪个字段决定分库 sharding-algorithm-name: db-inline # 使用的分库算法 # 分表策略 table-strategy: standard: sharding-column: user_id sharding-algorithm-name: table-inline # 使用的分表算法 # -------------------------- # 分库和分表算法定义 # -------------------------- sharding-algorithms: # 分库算法 db-inline: type: INLINE # 内联表达式算法 props: algorithm-expression: ds${user_id % 2} # 例如 user_id=3 -> 3%2=1 -> 使用 ds1 数据源 # 分表算法 table-inline: type: INLINE props: algorithm-expression: order_${user_id % 2} # 例如 user_id=3 -> 3%2=1 -> 使用 order_1 表 # -------------------------- # ShardingSphere 全局配置 # -------------------------- props: sql-show: true # 打印最终执行的 SQL,方便调试和验证分库分表是否生效dbKey = "db" + userId % 2; -》algorithm-expression: ds${user_id % 2}
table = "order_" + userId % 2;-》algorithm-expression: order_${user_id % 2}
ShardingSphere
内部 SQL 路由引擎
自动选择 ds0 / ds1
AST 级 SQL Rewrite
支持 join / 子查询
@Select("select * from order where user_id = #{userId}")
Order select(@Param("userId") Long userId);
ShardingSphere 实际执行: select * from order_1 where user_id = ? -- DataSource = ds1| 场景 | 结论 |
|---|---|
| 单表百万级 | 不需要 |
| 分表但不分库 | 可选 |
| 分库 + 分表 | 必须 |
| 分库 + 事务 | 必须 |
| 多表 join | 必须 |