news 2026/4/15 21:29:44

MLIR 中最常用的方言

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
MLIR 中最常用的方言

MLIR 的强大之处在于它的多层方言栈。通过不同层级的方言,MLIR 可以从高级的算法描述一直转换到最底层的机器码。

按照从“高级/抽象”到“低级/具体”的顺序,以下是 MLIR 中最常用的方言:


1. 高层方言 (High-Level / Domain Specific)

这类方言通常靠近算法逻辑,比如深度学习。

  • TOSA(Tensor Operator Set Architecture):

  • 用途:提供了一套标准化的张量算子(如卷积、池化、激活)。

  • 地位:它是很多模型转换器的入口(如 TensorFlow/PyTorch 导入 MLIR 后通常先转为 TOSA)。

  • Linalg(Linear Algebra):

  • 用途:处理结构化控制流和线性代数。

  • 核心:它既可以表示张量计算,也可以表示内存计算。它能自动生成嵌套循环,是生成高性能代码的关键层。


2. 中层/通用方言 (Mid-Level / Infrastructure)

这类方言是 MLIR 的“粘合剂”,几乎在所有程序中都会用到。

  • Arith(Arithmetic):

  • 用途:基础算术运算。处理整数和浮点数的加减乘除、位运算、常量定义。

  • Func(Function):

  • 用途:处理函数定义、调用、返回。是构建程序结构的基础。

  • ControlFlow(CF):

  • 用途:处理分支跳转(br)、条件判断(cond_br)等原始控制流。

  • SCF(Structured Control Flow):

  • 用途:提供高级的结构化循环(scf.forscf.ifscf.while)。比起 CF 更加易于分析和优化。


3. 数据与内存方言 (Data Management)

决定了数据在硬件中是如何存放和访问的。

  • Tensor:

  • 特点:不可变(Immutable)的数据抽象。主要用于高层图优化,不涉及具体内存地址。

  • MemRef(Memory Reference):

  • 特点:可变(Mutable)的内存引用。它描述了数据在内存里的布局(形状、步长、偏移)。

  • 转换:通常由Tensor方言通过Bufferization(缓冲化)转换而来。

  • Index:

  • 用途:专门用于表示数组下标、循环索引的类型,屏蔽了不同硬件上 32 位或 64 位整数的区别。


4. 底层/硬件方言 (Low-Level / Target Specific)

这类方言已经非常接近汇编语言。

  • LLVM:

  • 用途:MLIR 的“最后一公里”。它几乎与 LLVM IR 对应,用于最后交给 LLVM 后端生成机器码。

  • Vector:

  • 用途:处理 SIMD(单指令多数据)指令。它是高性能计算的核心,负责把普通计算映射到 CPU 的专用向量寄存器(如 AVX512)。

  • GPU:

  • 用途:抽象了 GPU 的并行逻辑(如 Kernel 发射、线程块、共享内存)。它可以进一步转换为NVVM(NVIDIA) 或ROCDL(AMD)。


总结:一个典型的编译路线图

当你编译一个模型时,数据通常是这样“降级”(Lowering)的:

  1. 输入:PyTorch 模型
  2. TOSA/Linalg:描述“我要做一个卷积”。
  3. SCF / Affine:把卷积拆解成“几层for循环”。
  4. Vector / MemRef:把循环里的计算变成“向量加法”,并分配物理内存。
  5. LLVM:变成 LLVM IR。
  6. 输出:二进制可执行文件。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/10 22:19:24

shadPS4模拟器深度评测:在PC上完美运行PS4游戏的完整指南

作为目前最活跃的开源PS4模拟器项目,shadPS4正在重新定义跨平台游戏体验。这款基于C开发的模拟器支持Windows、Linux和macOS三大平台,通过Vulkan渲染引擎和先进的着色器重编译技术,让玩家在PC上享受PS4游戏的乐趣。 【免费下载链接】shadPS4 …

作者头像 李华
网站建设 2026/4/14 4:10:54

硬件流控信号解析:RTS/CTS在UART中的应用说明

深入理解 UART 硬件流控:RTS/CTS 如何让串口通信更可靠?你有没有遇到过这种情况:MCU 正在高速发送数据给 Wi-Fi 模块,突然一部分配置信息“消失”了?或者 GPS 模块在高波特率下偶尔丢星、定位漂移?排除接线…

作者头像 李华
网站建设 2026/4/3 2:42:06

PaddlePaddle图像裁剪自动构图Auto Cropping

PaddlePaddle图像裁剪自动构图(Auto Cropping) 在内容爆炸的时代,一张图片的“第一眼吸引力”往往决定了它能否被点击、传播甚至转化。无论是电商平台的商品主图、短视频平台的封面,还是社交媒体的信息流缩略图,图像都…

作者头像 李华
网站建设 2026/4/8 21:49:38

AI生成CAD的终极指南:从文字描述到专业设计的轻松转变

AI生成CAD的终极指南:从文字描述到专业设计的轻松转变 【免费下载链接】text-to-cad-ui A lightweight UI for interfacing with the Zoo text-to-cad API, built with SvelteKit. 项目地址: https://gitcode.com/gh_mirrors/te/text-to-cad-ui 还记得那个让…

作者头像 李华
网站建设 2026/4/16 10:42:08

终极指南:3分钟掌握CreamApi游戏DLC自动解锁工具

终极指南:3分钟掌握CreamApi游戏DLC自动解锁工具 【免费下载链接】CreamApi 项目地址: https://gitcode.com/gh_mirrors/cr/CreamApi 还在为昂贵的游戏DLC发愁吗?CreamApi这款强大的开源工具能帮你轻松解锁Steam、Epic和Ubisoft平台的付费DLC内容…

作者头像 李华