深度剖析erase在固件更新中的初步应用-编程阁

擦除的艺术：深入理解固件更新中的 Flash erase 操作

你有没有遇到过这样的情况——设备明明收到了新固件，烧录过程也“顺利完成”，但重启后却卡在启动阶段，甚至直接变砖？
如果你排查到最后发现是旧数据没清干净导致的写入异常，那问题很可能出在一个看似简单、实则至关重要的步骤上：erase（擦除）。

在嵌入式系统的固件更新流程中，我们常把注意力放在“下载”和“写入”上，却容易忽视一个前提条件：任何写入之前，必须先擦除。这不是软件层面的“删除文件”，而是一次底层硬件级别的强制重置。今天，我们就来彻底讲清楚——为什么 erase 如此关键，它到底做了什么，又该如何正确使用。

一、从一个真实场景说起：为何不能“直接覆盖”？

想象一下你在一张写满字的纸上修改内容。如果只是用笔划掉几个错别字，再写上新的，结果会怎样？大概率是字迹重叠、难以辨认，甚至引发误解。

Flash 存储器面临的就是类似的问题，但它比纸张“固执”得多：
-它可以将“1”变成“0”（通过编程操作写入数据）；
-但无法把“0”变回“1”—— 要想恢复为“1”，必须执行一次完整的erase 操作。

这意味着：如果你想在一个已有数据的 Flash 区域写入新内容，而这些区域里存在已经被设为“0”的位，那么不先擦除的话，新数据就无法完整写入。最终结果不是部分丢失，就是逻辑混乱。

举个例子：

原始值：0x5A→ 二进制01011010
目标值：0xAA→ 二进制10101010

观察每一位的变化：
- 第7位：0 → 1❌ 必须擦除才能实现
- 第6位：1 → 0✅ 可以直接编程
- ……

所以如果不先擦除，这一位永远无法变为“1”。最终写入的结果将是原始值与目标值之间的某种“与”或“冲突态”，显然不是我们想要的。

这正是为什么——所有对 Flash 的有效写入，都必须建立在已擦除的基础上。

二、erase 到底是什么？不只是“清空”

它的本质是一场物理重置

Flash 存储单元基于浮栅晶体管（Floating Gate MOSFET），信息以电荷形式存储。当电子被注入浮栅时，阈值电压升高，表示逻辑“0”；而erase 的作用，就是把这些电子强行抽走，让整个区块回到全“1”状态（通常是0xFF）。

这个过程依赖的是Fowler-Nordheim 隧穿效应，需要施加较高的电压脉冲，耗时较长，且会对材料造成微小损耗。

因此，erase 不是一个轻量级操作，而是具有以下鲜明特征：

特性	说明
最小单位大	不能按字节擦除，通常以扇区（4KB、32KB）或块为单位
不可逆	一旦开始，中途断电可能导致半擦除状态，极难恢复
寿命有限	每个扇区支持约 1万~10万次擦写，需考虑磨损均衡
时间开销高	一个扇区擦除可能耗时 20~100ms，期间系统应保持稳定供电

这也解释了为什么很多低功耗设备会在电量低于一定阈值时禁止 OTA 升级——怕的就是擦到一半断电，直接损坏存储区。

三、固件更新流程中的关键屏障：erase 在哪一步？

在一个典型的 FOTA（Firmware Over-The-Air）流程中，大致可分为五个阶段：

接收新固件包（缓存至 RAM 或外部 Flash）
校验完整性（CRC / SHA）
擦除目标区域
写入新固件
设置启动标志并跳转

其中，第3步erase 是连接旧世界与新世界的桥梁。跳过它，等于试图在废墟上盖新房——结构注定不稳。

更严重的是，某些 Bootloader 会根据特定地址的内容判断是否存在有效固件。如果旧固件残留的数据恰好满足校验条件，系统可能会误引导到错误版本，造成安全隐患。

所以，标准做法是在每次更新前，明确擦除目标应用区，确保环境“干净”。

四、实战代码剖析：如何安全地执行一次扇区擦除？

以下是以 STM32H7 系列为例，在双 Bank 架构下擦除 Bank2 中某个扇区的典型实现（使用 HAL 库）：

#include "stm32h7xx_hal.h" #define FLASH_SECTOR_ADDR 0x08100000UL // App Secondary 区起始地址 #define FLASH_SECTOR_NUMBER FLASH_SECTOR_12 #define VOLTAGE_RANGE FLASH_VOLTAGE_RANGE_3 static void Flash_EraseSector(void) { FLASH_EraseInitTypeDef EraseConfig = {0}; uint32_t sector_error = 0; HAL_FLASH_Unlock(); // 解锁 Flash 控制权 // 配置擦除参数 EraseConfig.TypeErase = FLASH_TYPEERASE_SECTORS; EraseConfig.Banks = FLASH_BANK_2; EraseConfig.Sector = FLASH_SECTOR_NUMBER; EraseConfig.NbSectors = 1; EraseConfig.VoltageRange = VOLTAGE_RANGE; // 执行擦除 if (HAL_FLASHEx_Erase(&EraseConfig, &sector_error) != HAL_OK) { // 错误处理：可能是电压不足、地址非法或硬件故障 Error_Handler(); } HAL_FLASH_Lock(); // 操作完成后立即上锁 }

关键点解析：

HAL_FLASH_Unlock()：Flash 默认受保护，必须解锁才能操作；
FLASH_EraseInitTypeDef：定义了要擦哪个 Bank、哪个扇区、数量等；
HAL_FLASHEx_Erase()：阻塞式调用，直到完成或失败；
sector_error：可用于定位具体出错的扇区编号；
最后务必Lock，防止后续意外写入。

⚠️ 在 RTOS 环境中，建议将此函数运行在高优先级任务中，并关闭相关中断，避免因调度延迟影响稳定性。

五、常见坑点与应对策略

❌ 误区一：认为“只要没用到的地方就不需要擦”

即使你只更新了固件的一小部分，只要目标页中有任何一个字节曾被写过，就必须整体擦除该扇区。因为 Flash 写入是以页为单位进行编程的，而擦除粒度更大。

👉解决方案：尽量使固件大小对齐扇区边界，减少无效擦除；对于频繁小更新，可考虑使用支持 Page-Erase 的 SPI NOR Flash。

❌ 误区二：忽略电源稳定性，导致半擦除

低电压下，erase 可能未完成即退出，留下“既非全1也非可用”的中间状态。下次尝试写入时，可能出现奇奇怪怪的错误。

👉解决方案：
- 添加 VDD 监测电路，低于 3.0V 时拒绝执行 erase；
- 使用备用电源（如超级电容）支撑关键操作；
- 记录“正在更新”标志到 RTC Backup 寄存器，断电后可识别状态。

❌ 误区三：频繁擦同一扇区，加速老化

若每次更新都擦同一个扇区，其寿命很快耗尽，可能导致坏块累积。

👉解决方案：
- 实现简单的轮换机制（如 A/B 分区交替更新）；
- 引入轻量级文件系统（LittleFS、SPIFFS），自动管理磨损均衡；
- 记录各扇区擦除次数，动态避开高磨损区域。

✅ 进阶技巧：构建可靠的更新状态机

为了支持断点续传和异常恢复，可以设计如下状态标记：

状态	含义	是否需要 erase
`IDLE`	正常运行	否
`RECEIVING`	正在接收固件	否
`ERASING`	准备擦除目标区	是（首次进入时）
`WRITING`	写入新固件	否
`VERIFYING`	校验签名	否
`PENDING_RESET`	等待重启激活	否

利用非易失性标志位（如 EEPROM 或 Backup Domain）保存当前状态。若系统重启，可根据状态决定是否跳过 erase 阶段，避免重复擦除。

六、架构设计启示：从单区到双区，从手动到自动化

随着系统复杂度提升，我们可以基于 erase 的可控性，构建更高级的更新策略：

1. A/B 分区更新（Dual Bank）

将 Flash 分为两个独立的应用区；
当前运行 A 区，更新时擦除 B 区并写入新版本；
成功后切换启动指针，下次从 B 区运行；
支持无缝升级与自动回滚。

这种模式高度依赖精确控制的 erase 操作，确保每次只擦待更新的那一份副本。

2. 差分更新（Delta Update）

仅传输变化的部分，大幅降低带宽消耗；
在本地解压补丁后，仍需对目标区域执行 erase；
需保证补丁应用前后地址映射一致，否则擦错区域后果严重。

3. 安全启动链中的角色

在 TrustZone 或 Secure Boot 场景中，erase 操作本身也应受到权限控制：
- 普通任务无权调用 Flash 擦除 API；
- 所有 erase 请求由安全世界代理执行；
- 擦除前验证数字签名，防止恶意刷机。

七、结语：小操作，大责任

erase 看似只是一个准备动作，实则是整个固件更新链条中最不容出错的一环。

它不像加密那样炫酷，也不像压缩那样节省资源，但它默默承担着“清场人”的角色——只有它完成了使命，后续的一切才有意义。

掌握它的物理原理、熟悉它的行为边界、尊重它的资源消耗，才能真正做出稳定、可靠、可维护的嵌入式系统。

未来，尽管 MRAM、ReRAM 等新型存储技术有望摆脱“先擦后写”的限制，但在当前绝大多数产品中，Flash + erase 仍是主流。作为一名嵌入式开发者，理解并善用这一机制，是你通往高质量固件工程的必经之路。

如果你正在开发 OTA 功能，不妨问自己几个问题：
- 我的擦除逻辑是否具备幂等性和容错能力？
- 是否记录了足够的调试信息以便现场排查？
- 在电池电量低时，是否会阻止危险操作？

这些问题的答案，往往决定了你的用户是享受一次“静默升级”，还是经历一场“变砖救援”。

关键词回顾：erase、固件更新、Flash、非易失性存储器、扇区擦除、Bootloader、写入保护、原子性、磨损均衡、数据完整性、安全启动、HAL库、STM32、FOTA、存储管理。

欢迎在评论区分享你在实际项目中踩过的“erase 坑”或最佳实践！

深度剖析erase在固件更新中的初步应用