news 2026/6/9 23:39:41

CPU 和 PCIe 设备 地址转化

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CPU 和 PCIe 设备 地址转化

CPU 访问 PCIe 设备:CPU 物理地址(PA) → Root Port(ATU) → PCIe 总线地址

PCIe 设备 访问 CPU(DMA):PCIe 总线地址 → Root Port(ATU/IOMMU)→ CPU 物理地址(PA)

中间没有魔法,全部是地址映射 + 路由转发

3 种地址

  1. CPU 物理地址(CPU PA)
    • CPU 看到的地址
    • ECAM、BAR 都属于这类
  2. PCIe 总线地址(Bus Address)
    • PCIe 总线上传输的地址
    • 设备寄存器、DMA 都用这个
  3. 设备本地偏移(Device Offset)
    • 设备内部寄存器的偏移(如 0x00, 0x10)

CPU → 访问 PCIe 设备(读 / 写寄存器)

完整转化路径(硬件真实流程):

① 驱动发出虚拟地址

ioread32(virt_addr + 0x10);

② MMU 转为 CPU 物理地址(BAR 地址)

虚拟地址 → MMU → **CPU PA = 0x8010_0000**

③ 送到 PCIe Root Port

Root Port 查ATU(地址转换表)

CPU PA 0x8010_0000 → 映射为 PCIe 总线地址 0x0000_0010

④ Root Port 打包成 PCIe 报文

  • 地址:0x0000_0010
  • 路由:由BDF找到目标设备
  • 类型:Memory Write/Read

⑤ 设备收到报文

设备只认识PCIe 总线地址,不认识 CPU PA:

总线地址 0x0010 → 设备内部寄存器偏移 0x10

PCIe 设备 → 访问 CPU(DMA 写内存)

① 设备驱动告诉设备 DMA 地址

驱动写的是CPU PA,但设备不懂。

② Root Port 再次做转换

设备发:

PCIe 总线地址 = 0x8000_0000

Root Port 查表:

PCIe 总线地址 0x8000_0000 → CPU 物理地址 0x8000_0000

③ 发给内存控制器

最终写到 DRAM。

地址转化的两个硬件模块

Root Port 内部的 ATU

Address Translation Unit

  • 管:CPU PA ↔ PCIe 总线地址
  • 作用:让两边互不感知对方地址
  • 内核在枚举时配置好

IOMMU(可选,但服务器必开)

  • 管:PCIe 总线地址 → 最终内存地址
  • 作用:隔离、安全、虚拟化
  • 开启后:
    PCIe 地址 → IOMMU → 内存 PA

3 组关系

方向地址 A转化硬件地址 B用途
CPU→设备CPU 物理地址(BAR)Root Port ATUPCIe 总线地址寄存器读写
DMA←设备PCIe 总线地址Root Port / IOMMUCPU 物理地址DMA 访问内存
配置访问ECAM 物理地址Root Port 解析BDF 路由配置空间

BDF 路由表

每个 Bridge(Root Port / Switch Upstream / Switch Downstream)都有一张路由表,由三个寄存器构成:

  • Primary Bus Number(上游总线号)
  • Secondary Bus Number(本端口直连的下游总线)
  • Subordinate Bus Number(此端口下面所有子总线最大值)

这三个数,就是BDF 路由表

路由规则

当一个配置报文到达 Bridge:

目标 Bus = B 目标 Dev = D 目标 Func = F

Bridge 只看Bus 号 B

  1. B < Secondary Bus→ 报文是发给上游的 →往回发(Primary 方向)

  2. B == Secondary Bus→ 是直连设备 →从本端口发出去Dev/Func 由设备自己判断

  3. Secondary Bus < B ≤ Subordinate Bus→ 是我下面更深层的桥 →继续往下发(本端口)

  4. B > Subordinate Bus→ 不归我管 →不管,丢给上游

和 ATU 的区别

ATU 表:地址 → 地址(Mem 访问用)

BDF 路由表:Bus 号 → 哪个端口(Config 访问用)

  • 读 BAR、写 BAR、枚举设备 →走 BDF 路由
  • 读写寄存器、DMA →走地址(ATU)

极简总结

  1. BDF 路由表 = Primary / Secondary / Subordinate
  2. 只根据 Bus 号路由,不看 Dev/Func
  3. 每个桥都有一张
  4. 专门给配置事务(ECAM、config)用
  5. 内核扫描时自动配置
  6. 和 ATU 完全两回事:
    • ATU = 地址翻译
    • BDF 路由 = 配置报文转发路径

内核配置 ATU & BDF,扫描 PCIe 时:

  1. 通过ECAM找到设备BDF
  2. 读取BAR,知道需要多大地址窗口
  3. 分配一段CPU 物理地址
  4. CPU PA → PCIe 地址写入ATU
  5. 记住这个ATU 表项 对应 这个 BDF 设备

之后每次访问该 CPU PA:

  • Root Port 自动用ATU 翻译地址
  • 自动用BDF 路由到设备

关键总结

  1. CPU 不直接跟设备说话,靠 Root Port 翻译。
  2. CPU 用物理地址 PA设备用总线地址
  3. ATU 是翻译官
    • CPU 访问设备:PA → 总线地址
    • DMA 写内存:总线地址 → PA
  4. BAR 地址 = CPU 端的门牌号总线地址 = 设备端的门牌号Root Port 就是门牌翻译器
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 14:56:09

18GB显存搞定1M上下文:GLM-4-9B-Chat-1M部署避坑指南

18GB显存搞定1M上下文&#xff1a;GLM-4-9B-Chat-1M部署避坑指南 1. 为什么你需要关注这个“单卡长文本神器” 你有没有遇到过这些场景&#xff1a; 客户发来一份300页的PDF合同&#xff0c;要求10分钟内找出所有违约条款并生成摘要&#xff1b;财务团队每天要处理十几份200…

作者头像 李华
网站建设 2026/6/10 14:53:16

一步步提升SEO能力,从零开始实现网站流量的持续突破

内容优化是SEO策略中的重要环节&#xff0c;旨在创建符合搜索引擎要求的高质量内容。首先&#xff0c;核心关键词应自然融入文章各个部分&#xff0c;包括标题、首段及小标题&#xff0c;以确保整体的关键词相关性。此外&#xff0c;文章的结构应当清晰&#xff0c;通过逻辑性强…

作者头像 李华
网站建设 2026/6/10 15:24:07

YOLO X Layout对比实测:三种模型性能差异分析

YOLO X Layout对比实测&#xff1a;三种模型性能差异分析 文档智能处理的第一道关卡&#xff0c;从来不是文本识别&#xff0c;而是版面理解——它决定了后续OCR、表格解析、内容结构化能否准确开展。YOLO X Layout正是这样一款专为中文/英文混合文档设计的轻量级版面分析工具…

作者头像 李华
网站建设 2026/6/7 3:45:54

中文语义分析神器:REX-UniNLU系统功能全面解析

中文语义分析神器&#xff1a;REX-UniNLU系统功能全面解析 1. 系统概述与核心价值 REX-UniNLU是一个基于ModelScope DeBERTa模型构建的高精度中文自然语言处理系统。这个系统将前沿的AI算法与现代化的用户界面完美结合&#xff0c;让复杂的语义分析任务变得简单易用。 对于需…

作者头像 李华
网站建设 2026/6/10 14:02:48

本科论文通关秘籍:书匠策AI如何化身你的“学术外挂”

写本科论文时&#xff0c;你是否常陷入这些困境&#xff1a;选题像“大海捞针”&#xff0c;逻辑混乱如“一团乱麻”&#xff0c;格式调整让人“抓狂”&#xff0c;查重降重更是“生死局”&#xff1f;别慌&#xff01;今天要揭秘的科研神器——书匠策AI&#xff08;官网&#…

作者头像 李华
网站建设 2026/6/7 5:24:47

手把手教你用幻镜AI:证件照换背景、头像制作一键搞定

手把手教你用幻镜AI&#xff1a;证件照换背景、头像制作一键搞定 还在为制作证件照、更换头像背景而烦恼吗&#xff1f;无论是求职、考试报名&#xff0c;还是想在社交媒体上展示一张更专业的形象照&#xff0c;抠图换背景总是让人头疼。传统工具处理发丝、透明物体时效果不佳…

作者头像 李华