CANN/cann-bench：AddRmsNormDynamicQuant算子API描述-编程阁

AddRmsNormDynamicQuant 算子 API 描述

【免费下载链接】cann-bench评测AI在处理CANN领域代码任务的能力，涵盖算子生成、算子优化等领域，支撑模型选型、训练效果评估，统一量化评估标准，识别Agent能力短板，构建CANN领域评测平台，推动AI能力在CANN领域的持续演进。项目地址: https://gitcode.com/cann/cann-bench

1. 算子简介

Add、RMSNorm 和动态量化的融合。

主要应用场景：

大语言模型推理中残差连接 + 归一化 + 量化的融合加速
Transformer 模型中 RMSNorm 前的残差加法与后处理量化一体化
INT8/INT4 低精度推理的动态量化预处理

算子特征：

难度等级：L3（FusedComposite）
多输入多输出，融合 Add、RMSNorm 和动态量化三个操作
输入 x1、x2 为 ND 格式张量，gamma 为缩放参数

2. 算子定义

数学公式

$$ y, xOut, scaleOut = \text{quantize}(\text{rmsnorm}(x_1 + x_2) \times \gamma) $$

具体步骤：

Add 操作：$xOut = x_1 + x_2$
RMSNorm：$\text{normalized} = \frac{xOut}{\sqrt{\text{mean}(xOut^2) + \epsilon}} \times \gamma$
动态量化：根据 dst_type 将归一化结果量化为 INT8 或 INT4，同时输出量化 scale

3. 接口规范

算子原型

cann_bench.add_rms_norm_dynamic_quant(Tensor x1, Tensor x2, Tensor gamma, float epsilon, int dst_type) -> (Tensor y, Tensor xOut, Tensor scaleOut)

输入参数说明

参数	类型	默认值	描述
x1	Tensor	必选	第 1 个输入张量
x2	Tensor	必选	第 2 个输入张量
gamma	Tensor	必选	缩放参数
epsilon	float	1e-6	epsilon 值
dst_type	int	0	目标数据类型 (0:DT_INT8, 1:DT_INT4)

输出

参数	Shape	dtype	描述
y	与输入 x1 相同	int8 / int4	量化后的输出张量
xOut	与输入 x1 相同	float16 / bfloat16	Add 结果，x1 + x2
scaleOut	标量	float32	量化使用的 scale 值

数据类型

输入 (x1, x2, gamma) dtype	输出 y dtype	输出 xOut dtype	输出 scaleOut dtype
float16	int8 / int4	float16	float32
bfloat16	int8 / int4	bfloat16	float32

注意：INT4 量化（dst_type=1）的输出值范围为 [-8, 7]，由于 PyTorch 不支持 int4 dtype，实际存储为 int8 dtype。

规则与约束

x1 和 x2 的 shape 和 dtype 必须一致
gamma 的 dtype 须与 x1、x2 一致
x1 为 ND 格式
dst_type 取值：0 表示 DT_INT8，1 表示 DT_INT4
epsilon 用于 RMSNorm 的数值稳定性，默认 1e-6
scaleOut 为 float32 类型标量

4. 精度要求

采用生态算子精度标准进行验证。

误差指标：

平均相对误差（MERE）：采样点中相对误差平均值
$$ \text{MERE} = \text{avg}(\frac{\text{abs}(actual - golden)}{\text{abs}(golden)+\text{1e-7}}) $$
最大相对误差（MARE）：采样点中相对误差最大值
$$ \text{MARE} = \max(\frac{\text{abs}(actual - golden)}{\text{abs}(golden)+\text{1e-7}}) $$

通过标准：

数据类型	FLOAT16	BFLOAT16	FLOAT32	HiFLOAT32	FLOAT8 E4M3	FLOAT8 E5M2
通过阈值(Threshold)	2^-10	2^-7	2^-13	2^-11	2^-3	2^-2

当平均相对误差 MERE < Threshold，最大相对误差 MARE < 10 * Threshold 时判定为通过。

5. 标准 Golden 代码

import torch """ AddRmsNormDynamicQuant 算子 Torch Golden 参考实现 Add、RMSNorm 和动态量化的融合 公式：y, xOut, scaleOut = quantize(rmsnorm(x1 + x2) * gamma) """ def add_rms_norm_dynamic_quant( x1: torch.Tensor, x2: torch.Tensor, gamma: torch.Tensor, epsilon: float = 1e-6, dst_type: int = 0 ) -> tuple[torch.Tensor, torch.Tensor, torch.Tensor]: """ Add、RMSNorm 和动态量化的融合 公式：y, xOut, scaleOut = quantize(rmsnorm(x1 + x2) * gamma) Args: x1: 第 1 个输入张量 x2: 第 2 个输入张量 gamma: 缩放参数 epsilon: epsilon 值 dst_type: 目标数据类型 (0:DT_INT8, 1:DT_INT4) Returns: y: 量化后的输出张量 xOut: Add 结果，x1 + x2 scaleOut: 量化使用的 scale 值 """ # Add 操作 xOut = x1 + x2 # RMSNorm variance = xOut.pow(2).mean(-1, keepdim=True) rms = torch.sqrt(variance + epsilon) normalized = xOut / rms y_norm = normalized * gamma # 动态量化 # 将 y_norm 转换为 float32 以保证 scale 计算精度和 dtype 正确 y_norm_f32 = y_norm.float() if dst_type == 0: # INT8 scale = (127.0 / y_norm_f32.abs().max()).to(torch.float32) y = torch.clamp((y_norm_f32 * scale.item()).round(), -128, 127).to(torch.int8) else: # INT4 (存储为 int8，值范围 [-8, 7]) scale = (7.0 / y_norm_f32.abs().max()).to(torch.float32) y = torch.clamp((y_norm_f32 * scale.item()).round(), -8, 7).to(torch.int8) return y, xOut, scale

6. 额外信息

算子调用示例

import torch import cann_bench x1 = torch.randn(2, 4096, dtype=torch.float16, device="npu") x2 = torch.randn(2, 4096, dtype=torch.float16, device="npu") gamma = torch.ones(4096, dtype=torch.float16, device="npu") y, xOut, scaleOut = cann_bench.add_rms_norm_dynamic_quant(x1, x2, gamma, 1e-6, 0) # INT8 量化 y, xOut, scaleOut = cann_bench.add_rms_norm_dynamic_quant(x1, x2, gamma, 1e-6, 1) # INT4 量化

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

CANN/cann-bench：AddRmsNormDynamicQuant算子API描述

AddRmsNormDynamicQuant 算子 API 描述

1. 算子简介

2. 算子定义

数学公式

3. 接口规范

算子原型

输入参数说明

输出

数据类型

规则与约束

4. 精度要求

5. 标准 Golden 代码

6. 额外信息

算子调用示例

KrkrzExtract终极指南：三步掌握krkrz引擎资源解包神器

零基础上手 GPT-Image-2：在 kulaai 上生成第一张 AI 图片的图文教程

卡梅德生物技术快报|豆科植物遗传转化：紫穗槐 AfRAP2 基因克隆与转化豆科植物遗传转化技术全流程解析

CANN算子Cumsum测试报告

浅谈GaussDB (DWS)技术【玩转PB级数仓GaussDB(DWS)】

第二天打卡

AddRmsNormDynamicQuant 算子 API 描述

1. 算子简介

2. 算子定义

数学公式

3. 接口规范

算子原型

输入参数说明

输出

数据类型

规则与约束

4. 精度要求

5. 标准 Golden 代码

6. 额外信息

算子调用示例

KrkrzExtract终极指南：三步掌握krkrz引擎资源解包神器

零基础上手 GPT-Image-2：在 kulaai 上生成第一张 AI 图片的图文教程

卡梅德生物技术快报|豆科植物遗传转化：紫穗槐 AfRAP2 基因克隆与转化 豆科植物遗传转化技术全流程解析

CANN算子Cumsum测试报告

浅谈GaussDB (DWS)技术【玩转PB级数仓GaussDB(DWS)】

第二天打卡

卡梅德生物技术快报|豆科植物遗传转化：紫穗槐 AfRAP2 基因克隆与转化豆科植物遗传转化技术全流程解析