news 2026/5/10 3:29:32

CANN/ops-transformer注意力融合算子

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ops-transformer注意力融合算子

AttentionWorkerCombine

【免费下载链接】ops-transformer本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-transformer

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT×
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品×
Atlas 推理系列产品×
Atlas 训练系列产品×

功能说明

  • 算子功能:将多个计算单元处理的注意力token数据进行融合,结合专家权重对结果进行加权,输出最终的注意力融合结果,并更新层ID。

参数说明

参数名输入/输出/属性描述数据类型数据格式
schedule_context输入包含调度上下文信息。INT8ND
expert_scales输入表示专家权重。FLOATND
layer_id输入当前的模型层ID。INT32ND
y输出最终的注意力合并结果。FLOAT16,BFLOAT16ND
next_layer_id输出下一个要处理的层ID。INT32ND
hidden_size属性token_data的隐藏维度大小,用于确定输出y的第二维大小。必要属性。Int-
token_dtype属性指定schedule_context中token数据的原始精度类型,0表示FLOAT16,1表示BFLOAT16。Int-
need_schedule属性指定是否等待token数据填充完成后再执行,0表示不等待,1表示等待。Int-

约束说明

  • schedule_context为1D的Tensor。
  • expert_scales为2D的Tensor,[BatchSize, K]。
  • y为2D的Tensor,[BatchSize, HiddenSize],即第二维由属性hidden_size确定。
  • layer_id和next_layer_id为1D的Tensor。

调用说明

调用方式样例代码说明
图模式调用test_geir_attention_worker_combine.cpp通过算子IR构图方式调用AttentionWorkerCombine算子。

【免费下载链接】ops-transformer本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-transformer

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/10 3:29:31

CANN/catlass Epilogue适配开发指南

Epilogue适配与开发详解 【免费下载链接】catlass 本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。 项目地址: https://gitcode.com/cann/catlass 1. Epilogue概述 Epilogue是矩阵乘法(GEMM)计算的最后…

作者头像 李华
网站建设 2026/5/10 3:27:59

对比自行维护API中转与使用Taotoken在稳定性上的体感差异

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 对比自行维护API中转与使用Taotoken在稳定性上的体感差异 对于需要频繁调用大模型API的开发者而言,服务的稳定性是保障…

作者头像 李华
网站建设 2026/5/10 3:26:46

面板波浪力人工神经网络预测与鲸鱼算法优化【附程序】

✨ 本团队擅长数据搜集与处理、建模仿真、程序设计、仿真代码、EI、SCI写作与指导,毕业论文、期刊论文经验交流。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流,点击《获取方式》 (1)自适应鲸鱼优化算法驱动的双向长短期记忆网络架构&…

作者头像 李华
网站建设 2026/5/10 3:26:46

基于OpenCV与PyAutoGUI的桌面自动化:从图像识别到虚拟宠物交互

1. 项目概述与核心价值最近在GitHub上看到一个挺有意思的项目,叫“VpetClaw”,作者是Cangminghai。乍一看这个名字,可能有点摸不着头脑,但点进去研究一下,你会发现这是一个关于“虚拟宠物”和“抓取”结合的开源项目。…

作者头像 李华
网站建设 2026/5/10 3:25:45

机器学习求解偏微分方程:算子学习与物理信息神经网络全解析

1. 项目概述:当机器学习遇上物理方程在工程和科学计算的漫长历史中,偏微分方程一直是描述物理世界最核心的数学语言。从流体的纳维-斯托克斯方程,到电磁场的麦克斯韦方程组,再到量子力学的薛定谔方程,这些方程构成了我…

作者头像 李华
网站建设 2026/5/10 3:24:38

深入解析数据库系统的三级模式与两级映像结构

引言 在当今信息时代,数据是企业与组织的核心资产。如何高效、安全、独立地管理这些数据,是数据库技术的核心使命。1975年,美国ANSI/SPARC研究组提出的数据库三级模式架构,为解决这一问题奠定了坚实基础。本文将从基本概念出发,结合生动实例与图表,深入剖析这一经典体系…

作者头像 李华