news 2026/4/16 12:44:56

蓝凌EKP产品:一次 Hibernate 乐观锁 + 死锁的深度踩坑实录

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
蓝凌EKP产品:一次 Hibernate 乐观锁 + 死锁的深度踩坑实录

—— clear() 一个集合,为什么引发 OptimisticLockException 和数据库死锁?

这是一次看似“新增 / 查询”的普通业务操作,却最终演变成
Hibernate 乐观锁异常 + MySQL 死锁 + 批量更新失败的连环事故。

一、问题现象

线上频繁出现如下异常:

javax.persistence.OptimisticLockException: Batch update returned unexpected row count from update [0]; actual row count: 0; expected: 1

伴随的数据库日志还有:

Deadlock found when trying to get lock; try restarting transaction SQL: delete from km_agreement_review_areader where fd_source_id=?

诡异点在于:

  • 表面调用的是新增审计意见 / 新增参数

  • 堆栈中指向的是find()查询

  • 实际报错却是update / delete

  • 涉及的表包括:

    • km_agreement_review_areader

    • lbpm_execution

怎么看都不像是一个地方的问题。

二、第一个误区:find / insert 不会触发乐观锁?

这是一个非常常见的误区。

在 Hibernate / JPA 中,只要触发了 flush,
所有被托管(managed)的实体都会被统一同步到数据库。

也就是说:

insert A find B

在 Hibernate 内部真实执行顺序是:

flush Session ├─ update / delete / insert(之前积攒的) └─ 然后才是 find B

异常只是“挂”在 find 上,
真正出问题的是 flush 里的 update / delete。

三、真正的导火索:BaseAuthModel 里的clear()

所有业务 Model 都继承了一个公共父类:

public abstract class BaseAuthModel { protected List authAllReaders; protected void recalculateReaderField() { if (authAllReaders == null) { authAllReaders = new ArrayList(); } else { authAllReaders.clear(); // 关键代码 } // 重新 add 各种 reader authAllReaders.add(getDocCreator()); ... } }

这一行代码,看起来极其“正常”:

authAllReaders.clear();

但在Hibernate 眼里,这是一个非常危险的操作

四、Hibernate 视角:clear() 到底干了什么?

假设映射关系是:

@OneToMany @JoinColumn(name = "fd_source_id") private List<Reader> authAllReaders;

那么:

authAllReaders.clear();

在 Hibernate 中等价于

delete from km_agreement_review_areader where fd_source_id = ?

如果接下来你又:

authAllReaders.add(...) authAllReaders.add(...)

Hibernate flush 时会执行:

delete from km_agreement_review_areader where fd_source_id = ? insert into km_agreement_review_areader ... insert into km_agreement_review_areader ...

五、为什么会死锁?

关键点:fd_source_id是外键

当多个并发请求同时操作同一个业务对象时:

  • 线程 A:clear → delete(持有子表行锁)

  • 线程 B:clear → delete(等待)

  • 线程 A:后续 update 父表 / execution

  • 线程 B:持有另一批锁

👉典型的 InnoDB 死锁模型

DELETE 子表 → UPDATE 父表 → DELETE 子表(另一个事务)

六、为什么又会触发 OptimisticLockException?

系统中只有一个地方配置了 version

<version name="lockerVersion" column="fd_locker_version" type="long"/>

配置在:lbpm_execution表。

而问题在于:

  • lbpm_execution在流程执行时早已被加载进 Session

  • clear / add Reader 的过程中:

    • execution 被标记为 dirty

  • flush 时 Hibernate 会顺带执行:

update lbpm_execution set fd_locker_version = fd_locker_version + 1 where fd_id = ? and fd_locker_version = ?

如果前面发生了:

  • 死锁回滚

  • 并发已更新

  • 行被别的事务影响

👉 update 0 行
👉 Hibernate 判定并发冲突
👉 抛OptimisticLockException

七、为什么堆栈看起来“很乱”?

因为这是统一 flush 导致的错觉

  • 报错点挂在find()

  • 实际执行的是:

    • delete 子表

    • update execution

  • Hibernate不会告诉你是哪一个实体被判定 dirty

这也是 Hibernate 最反直觉的地方之一。

八、问题的本质总结(一句话)

这是一个典型的:
ORM 管理集合 + clear + 并发 + version
共同作用下的“架构级事故”

九、解法一(最推荐):绕过 ORM 管理这个集合

❌ 错误姿势(当前做法)

@OneToMany private List authAllReaders;

并对其:

clear() + add()

✅ 正确姿势 1:不做批量异常在新增,只做增量

这里有现成方案,可以关注后续.....,
public void update(IBaseModel modelObj) throws Exception { IFieldsCalculator fieldsRecalculator = modelObj.getFieldsCalculator(); if(fieldsRecalculator!=null){ fieldsRecalculator.recalculateFields(); }else{ modelObj.recalculateFields(); } //modelObj.recalculateFields(); afterRecalculateFields(modelObj); getHibernateTemplate().saveOrUpdate(modelObj); }

model 实现接口IFieldsCalculator fieldsRecalculator = modelObj.getFieldsCalculator();完成model 的可阅读者的增量更新。

十、为什么这是“无解但必须改”的问题?

因为:

  • BaseAuthModel 是全局父类

  • clear() 是高频路径

  • 并发下必然出现:

    • 死锁

    • 乐观锁冲突

  • Hibernate 在这里帮不了你

👉必须从 ORM 设计上规避

十一、最终总结

Hibernate 非常适合“领域模型”
但需谨慎操作“权限计算 / 批量 clear + 重建”这种模型

这次问题的真正收获不是“修一个 bug”,而是:

  • 明确了哪些集合不该交给 ORM 管

  • 明确了clear() 是 ORM 世界的核按钮

  • 明确了version 不该用在流程执行上下文上

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/15 10:01:33

PyTorch中通过设置随机种子使训练结果可复现

由于存在随机性&#xff0c;在同一台机子上&#xff0c;即使完全一致的代码&#xff0c;默认情况下&#xff0c;PyTorch每次训练的结果也有差异&#xff0c;无法复现。做了少许改动后&#xff0c;重新训练&#xff0c;结果有微小的变化&#xff0c;无法判断这变化是因改动导致的…

作者头像 李华
网站建设 2026/4/16 7:20:53

Excalidraw语音注释功能设想:多模态交互探索

Excalidraw语音注释功能设想&#xff1a;多模态交互探索 在一场紧张的远程架构评审会上&#xff0c;主讲人一边讲解系统设计&#xff0c;一边手忙脚乱地切换麦克风和鼠标——刚说到“这个服务要加个熔断机制”&#xff0c;却不得不暂停讲述去拖拽一个新组件。思维被打断&#x…

作者头像 李华
网站建设 2026/4/15 15:29:35

Win10/11系统下WSL2+Ubuntu的全流程安装

Win10/11系统下WSL2Ubuntu的全流程安装 WSL介绍 WSL&#xff08;Windows Subsystem for Linux&#xff09;是微软为 Windows 10 和 Windows 11 提供的一个兼容层&#xff0c;允许用户在 Windows 环境下原生运行 Linux 发行版。WSL 可以让开发者和系统管理员在 Windows 上使用…

作者头像 李华
网站建设 2026/4/16 9:06:41

Excalidraw蓝绿发布策略:零停机更新服务

Excalidraw蓝绿发布策略&#xff1a;零停机更新服务 在远程协作日益成为工作常态的今天&#xff0c;一款白板工具是否“稳定可用”&#xff0c;往往直接决定了团队能否顺畅推进一次产品讨论或架构设计。Excalidraw 作为开源手绘风格协作白板的代表&#xff0c;凭借其简洁体验与…

作者头像 李华
网站建设 2026/4/16 11:03:18

Excalidraw CI/CD流水线搭建:代码变更自动部署

Excalidraw CI/CD 流水线构建&#xff1a;从代码提交到自动部署的实践 在现代团队协作中&#xff0c;可视化工具早已不再是可有可无的辅助品。尤其是在远程办公常态化、敏捷开发深入落地的背景下&#xff0c;像 Excalidraw 这类轻量级、高自由度的手绘风格白板工具&#xff0c…

作者头像 李华
网站建设 2026/4/16 9:08:21

【FreeRTOS实战】互斥锁专题

【FreeRTOS实战】互斥锁专题 更详细的开发过程请参考【FreeRTOS实战】信号量专题&#xff1a;从底层原理到中断同步。 5. 实际应用案例&#xff1a;从理论到STM32代码 5.1 案例1&#xff1a;优先级反转演示与解决方案 下面我们通过一个完整的STM32代码示例&#xff0c;演示…

作者头像 李华