news 2026/6/10 11:05:13

嵌入式Linux多线程防止死锁

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
嵌入式Linux多线程防止死锁

一、并发的本质

1. 并发≠并行

先弄清楚两个概念:

  • 并发(Concurrency):多个任务在时间片上交替执行,宏观上"同时",微观上是串行切换

  • 并行(Parallelism):多个任务在多个CPU核心上真正同时执行

在单核ARM芯片上,你写的多线程代码是并发;在多核处理器上,才可能是并行。但无论哪种情况,只要存在共享资源,就必须面对竞态条件(Race Condition)

2. 竞态的根源

竞态的根源是多个执行流对共享资源的访问顺序不确定。解决它,就是多线程编程的核心。

访问顺序不确定有如下几种情况:

(1)一行C代码≠一条指令

看这段常见的计数器代码:

counter++看起来简单,编译后实际是三条指令:

LOAD counter → 寄存器 ADD 寄存器 + 1 STORE 寄存器 → counter

两个线程各执行10万次,理论结果是20万。但实测往往只有13-18万。原因就是两个线程的指令可能"交叉执行"。

(2)编译器和CPU乱序执行

为了优化性能,编译器可能重排指令顺序,CPU也有乱序执行机制。我们写的代码顺序,不一定是实际执行顺序。

(3)多核CPU各有各的缓存

每个核心都有自己的L1/L2 Cache,对同一内存地址的修改,不会立即对其他核心可见。这叫缓存一致性问题

二、POSIX线程库三大同步原语

POSIX线程库提供了几种同步机制,互斥锁、条件变量、读写锁。

2.1 互斥锁

互斥锁的语义很简单:同一时刻只有一个线程能持有锁

需要特别注意的是:锁的粒度要小

如果误把整个业务逻辑都放在锁里面,结果多线程变成了排队执行,性能还不如单线程。

错误示范:锁的粒度太大的例子

正确做法:只锁共享数据的访问,不锁计算逻辑

2.2 条件变量

生产者线程产生数据,消费者线程处理数据。消费者怎么知道"有数据了"?这时候可以使用条件变量。

条件变量正是解决线程等待-通知场景的最优解——它能让线程在条件不满足时休眠,条件满足时精准唤醒,既保证响应速度,又能最大化降低CPU占用。

错误方案:轮询方式

正确方案:使用条件变量

使用条件变量的典型步骤:

等待方步骤

  1. 加互斥锁(pthread_mutex_lock);

  2. 循环检查条件(while(condition == false));

  3. 条件不满足时,调用pthread_cond_wait休眠;

  4. 被唤醒后,重新检查条件,执行业务逻辑;

  5. 解锁互斥锁(pthread_mutex_unlock)。

通知方步骤

  1. 加互斥锁(pthread_mutex_lock);

  2. 修改条件(如:设置flag为true、添加数据到队列);

  3. 发送通知(pthread_cond_signal或pthread_cond_broadcast);

  4. 解锁互斥锁(pthread_mutex_unlock)。

代码如:

为什么必须用while而不是if?

因为存在虚假唤醒"(spurious wakeup)——线程可能在没有收到signal的情况下被唤醒。这是POSIX标准允许的行为,用while可以再次检查条件。

2.3 读写锁

如果你的场景是"90%读、10%写",用互斥锁太浪费——读操作之间本不需要互斥。

下图对比三种同步原语的适用场景:

三、死锁

比方说两个线程甚至多个线程,需要获取两个临界值,也就是需要两个锁

死锁是多线程编程最经典的问题。它的四个必要条件(Coffman条件):

  1. 互斥:资源不能共享

  2. 持有并等待:持有一个锁的同时等待另一个锁

  3. 不可抢占:锁不能被强制释放

  4. 循环等待:A等B,B等A

破坏任意一个条件就能预防死锁。实践中最有效的是破坏"循环等待":规定加锁顺序

经典AB-BA死锁例子如:

以上程序卡死,CPU占用为0。这是经典的AB-BA死锁模式。两个线程以相反的顺序获取两把锁,在特定时序下互相等待,形成死锁。

执行时序图

为什么发生死锁呢?

线程1和线程2同时启动,线程1获取了锁A,又想要获取锁B,此时线程2获取了锁B,又想要获取锁A,此时两个线程都不能获取第二个锁,就形成了死锁

如何解决呢?两个线程获取锁的顺序一定要一致,比如一开始都去获取锁A,当一个线程获取到了锁A,另外一个线程就会进入等待,此时不会形成死锁

修复以上死锁问题:统一加锁顺序

释放锁的时候都是先B后A

规避死锁问题的工程实践建议

  • 在代码规范中明确锁的层级顺序

  • 使用pthread_mutex_trylock实现超时机制

  • 开发阶段启用死锁检测工具(如Helgrind、ThreadSanitizer)

四、总结

三条核心原则

  1. 最小化共享:能不共享就不共享,能用消息传递就不用共享内存

  2. 最小化临界区:锁的粒度越小越好,只保护数据访问,不保护计算逻辑

  3. 统一加锁顺序:从根源上避免死锁

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/8 12:27:32

Langchain-Chatchat在社保查询服务中的落地场景

Langchain-Chatchat在社保查询服务中的落地场景 在政务服务日益数字化的今天,一个看似简单的“失业保险怎么领”问题,背后却牵动着政策文件、地方细则、历史沿革和个性化条件的复杂交织。群众反复跑窗口、电话咨询排长队、网上信息碎片化——这些传统服务…

作者头像 李华
网站建设 2026/6/10 9:13:27

【I2C协议】

规格和从机地址传输1、I2C的信号2、数据的有效性(I2C是电平触发采样)SDA的可变化时机数据线(SDA)上的数据只能在时钟线(SCL)为低电平时进行改变。SDA的稳定性SCL为高电平期间,SDA必须保持稳定。…

作者头像 李华
网站建设 2026/6/7 13:03:12

会议论文A RAG Approach for Generating Competency Questions in Ontology Engineering

此文章发表在MTSR2024会议,主题和能力问题有关,另外结合了RAG。 作者信息 荷兰的机构,文章12页。 要点1 我在2024年想到所谓需求驱动,也是结合能力问题的。当时觉得能力问题像是上个世纪的产物,一种古老的验证手段…

作者头像 李华
网站建设 2026/6/6 15:30:28

钻井工程的老师傅们总爱念叨一句话——井筒周围的应力分布能决定钻井成败。今天咱们用COMSOL做个流固耦合的实战模拟,看看地层压力是怎么在井筒周围“搞事情“的

COMSOL模拟流固耦合井筒周围应力分布。 此案列介绍在井筒壁周围施加径向荷载(孔压和地应力),分析其径向应力、环向应力以及孔压变化,附有详细的建模说明书。打开COMSOL新建模型,先选"多物理场耦合"里的达西流-固体力学接…

作者头像 李华