ARM CoreSight SoC-600调试系统常见问题解析-编程阁

1. CoreSight SoC-600调试系统架构解析

CoreSight作为ARM架构下的片上调试与追踪解决方案，其SoC-600版本在复杂SoC设计中扮演着关键角色。这套系统主要由两大核心模块构成：Trace Memory Controller（TMC）负责实时捕获和存储处理器执行轨迹，Debug Port（DP）则处理外部调试器与芯片的通信协议。在实际应用中，这两个模块的协同工作为开发者提供了完整的运行时洞察能力。

从硬件实现角度看，TMC通过AXI总线与系统内存交互，其地址宽度配置（AXI_ADDR_WIDTH）直接影响可寻址空间。而Debug Port支持JTAG和Serial Wire两种主流调试协议，协议选择会影响APACC（Access Port Access）事务的吞吐效率。这些设计特性在带来灵活性的同时，也埋下了某些特定场景下的行为异常隐患。

2. Trace Memory Controller的4GB内存限制问题

2.1 问题现象与触发条件

当TMC配置为ETR（Embedded Trace Router）模式时，若同时满足以下条件将触发寻址异常：

AXI_ADDR_WIDTH参数设为32位
DEVID.AW寄存器显示0x20（32位地址总线配置）
RSZ寄存器被设置为4GB内存空间
STS.Full标志置1
ETR从Disabled状态进入Running状态

此时TMC无法正常运作，表现为追踪数据丢失或控制器无响应。这个问题在r0p0到r0p6的TMC版本以及r1p0的TMC_ETR版本中均存在，直到r6p0版本才被修复。

2.2 技术原理深度分析

32位地址总线理论上可寻址4GB空间（2^32=4,294,967,296字节），但实际实现中存在两个关键限制：

地址空间保留：通常最高地址区域（如0xFFFF_FFFF）会被保留用于特殊用途
地址回绕问题：当计数器达到最大值时可能发生不可预测的地址回绕

在TMC的特定实现中，内部状态机对满状态（STS.Full）的处理与32位地址边界存在交互问题，导致地址计算异常。这属于典型的边界条件处理缺陷。

2.3 解决方案与实施建议

Arm官方提供了三种规避方案：

方案一：限制内存分配

// 在进入Running状态前设置RSZ寄存器 write_reg(TMC_RSZ, 0xFFFF0000); // 设置为略小于4GB的值

方案二：紧急状态恢复流程

清除CTL.TraceCaptEn位
轮询STS.TMCReady直到返回0
重新配置RSZ为小于4GB的值
重新使能追踪捕获

方案三：硬件配置修改在RTL设计阶段将AXI_ADDR_WIDTH参数设为大于32的值（如33或64），这需要重新综合IP核。

实际工程中选择方案一最为简便，但需注意：
内存分配应保留至少1MB的余量（建议0xFFF00000）
在系统启动早期就要完成RSZ配置
通过DEVID寄存器验证硬件版本是否受影响

3. Debug Port性能下降问题解析

3.1 JTAG协议下的吞吐量问题

在r0p2和r0p3版本的Debug Port中，当使用JTAG协议时会出现额外的WAIT响应：

每个APACC写操作必定产生1个额外WAIT
每个APACC读操作必定产生1个额外WAIT

这会导致背靠背访问时的有效带宽下降约30%。问题根源在于DP的状态机未能及时释放APB接口就绪信号，在r3p2版本中通过优化流水线握手协议解决了此问题。

性能影响示例：假设：

JTAG时钟频率为10MHz
正常每个APACC事务需要5个时钟周期
受此问题影响后变为6个周期

则最大理论吞吐量从2M事务/秒降为1.67M事务/秒。

3.2 Serial Wire协议下的类似问题

在相同硬件版本下，Serial Wire协议也存在吞吐问题：

APACC写操作至少产生1个WAIT
当SWCLKTCK:CLK > 1:5时，读操作至少产生1个WAIT

时钟比例临界值计算：若系统时钟为100MHz，则SWCLKTCK超过20MHz时会触发读延迟。这源于时钟域同步逻辑的保守设计。

3.3 无解决方案下的工程应对

由于这两个问题在硬件层面没有可行的规避方案，建议采取以下措施：

尽量使用r3p2或更新版本的DP IP
在必须使用受影响版本时：
- 降低JTAG/SW时钟频率以换取稳定性
- 避免密集的小数据量访问，改用burst传输
- 在调试脚本中增加操作间隔

4. TPIU模块的异常停止问题

4.1 FFCR写入导致的追踪停止

在r0p0和r1p0版本的TPIU中，当同时满足：

FFCR.EnFCont=1（连续格式化模式）
FFCR.StopTrig或FFCR.StopFl=1
调试工具在TPIU未停止时清除StopTrig/StopFl

会导致ATB从接口无限期挂起，表现为：

FFSR.FlInProg保持为1
不再接受新的追踪数据
需要硬件复位才能恢复

正确操作流程：

// 错误的操作顺序： write_reg(TPIU_FFCR, read_reg(TPIU_FFCR) & ~(STOPTRIG | STOPFL)); // 正确的操作顺序： while(!(read_reg(TPIU_FFSR) & FTSTOPPED)); // 等待停止完成 write_reg(TPIU_FFCR, read_reg(TPIU_FFCR) & ~(STOPTRIG | STOPFL));

4.2 触发器计数器写入问题

同样在TPIU中，当：

启用连续格式化模式
TCVR寄存器被设为非零值
在内部缓冲器清空前将TCVR写为0

会导致类似的ATB接口挂起。解决方法是在修改TCVR前确保FFSR.FtStopped=1。

调试工具实现建议：

增加状态检查包装函数：

void safe_write_tcvr(uint32_t value) { while(!(read_reg(TPIU_FFSR) & FTSTOPPED)); write_reg(TPIU_TCVR, value); }

在GUI调试器中禁用TCVR编辑除非TPIU已停止

5. ATB Replicator的DEVID寄存器异常

可编程ATB Replicator（css600_atbreplicator_prog）在r0p0版本中存在DEVID寄存器位域错误：

bits[7:4]（SCHEME字段）错误地返回0x3
实际上该组件未实现优先级方案

软件兼容性处理：应在驱动程序中屏蔽这些位：

#define REPLICATOR_DEVID_SCHEME_MASK 0xFFFFFF0F uint32_t get_replicator_devid(void) { return read_reg(REPLICATOR_DEVID) & REPLICATOR_DEVID_SCHEME_MASK; }

6. ETS配置下的Flush完成问题

在css600_tmc_ets的r0p2和r0p3版本中，当：

FFCR.StopFl=0
ATB从接口完成flush
AXI流主接口数据收集速度慢于ATB接口数据提供速度

会导致FFSR.FlInProg保持置位，后续flush请求被挂起。

紧急恢复步骤：

清除CTL.TraceCaptEn
等待进入DISABLING状态
重新配置参数
再次使能追踪

7. 版本兼容性速查表

问题描述	受影响版本	修复版本	严重等级
TMC 4GB限制	r2p0-r5p0	r6p0	高
DP JTAG吞吐量	r2p0-r3p1	r3p2	中
DP SW吞吐量	r2p0-r3p1	r3p2	中
TPIU FFCR写入	r3p0-r3p2	r4p0	高
TPIU TCVR写入	r3p0-r3p2	r4p0	高
ATB Replicator DEVID	r2p0-r3p0	r3p1	低
ETS Flush完成	r2p0-r3p0	r3p1	中

8. 实际调试经验分享

在基于CoreSight SoC-600的嵌入式系统开发中，我们总结了以下实用技巧：

版本识别自动化：

def check_erratas(soc_version): issues = [] if soc_version < 'r6p0': issues.append("TMC 4GB限制") if soc_version < 'r3p2': issues.append("DP吞吐量问题") return issues