news 2026/5/9 15:53:21

CANN/pyasc矩阵乘法全迭代API

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/pyasc矩阵乘法全迭代API

asc.language.adv.Matmul.iterate_all

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

Matmul.iterate_all(tensor: BaseTensor, en_atomic: int = 0, sync: bool = True, en_sequential_write: bool | None = None, wait_iterate_all: bool | None = None, fake_msg: bool | None = None) → None

调用一次iterate_all,会计算出singleCoreM * singleCoreN大小的C矩阵。

对应的Ascend C函数原型

template <bool sync = true> __aicore__ inline void IterateAll(const GlobalTensor<DstT>& gm, uint8_t enAtomic = 0, bool enSequentialWrite = false, bool waitIterateAll = false, bool fakeMsg = false)
template <bool sync = true> __aicore__ inline void IterateAll(const LocalTensor<DstT>& ubCmatrix, uint8_t enAtomic = 0)

参数说明

  • tensor: C矩阵,类型为GlobalTensor或LocalTensor。
  • en_atomic: 是否开启Atomic操作,默认值为0。
  • sync: 设置同步或者异步模式。
  • en_sequential_write: 是否开启连续写模式,仅支持输出到Global Memory场景。
  • wait_iterate_all: 是否需要通过wait_iterate_all接口等待iterate_all执行结束,仅支持异步输出到Global Memory场景。
  • fake_msg: 仅在IBShare场景和IntraBlockPartSum场景使用,仅在支持输出到Global Memory场景。

约束说明

  • 传入的C矩阵地址空间大小需要保证不小于single_core_m * single_core_n个元素。

调用示例

asc.adv.register_matmul(pipe, workspace, mm, tiling) mm.set_tensor_a(gm_a) mm.set_tensor_b(gm_b) mm.set_bias(gm_bias) mm.iterate_all(gm_c)

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 15:53:21

鸣潮自动化工具ok-ww:3大核心功能助你告别重复刷本烦恼

鸣潮自动化工具ok-ww&#xff1a;3大核心功能助你告别重复刷本烦恼 【免费下载链接】ok-wuthering-waves 鸣潮 后台自动战斗 自动刷声骸 一键日常 Automation for Wuthering Waves 项目地址: https://gitcode.com/GitHub_Trending/ok/ok-wuthering-waves 你是否厌倦了在…

作者头像 李华
网站建设 2026/5/9 15:51:37

互联网大厂 Java 求职面试:音视频场景中的 Java 技术栈

互联网大厂 Java 求职面试&#xff1a;音视频场景中的 Java 技术栈在今天的面试中&#xff0c;面试官将与搞笑的求职者燕双非进行一轮紧张而又趣味的技术问答。第一轮提问&#xff1a;音视频技术基础面试官&#xff1a;燕双非&#xff0c;首先请你谈谈 Java SE 8 的一些新特性&…

作者头像 李华
网站建设 2026/5/9 15:43:36

CANN/catlass 3D卷积偏置算子示例

ConvBias Example Readme 【免费下载链接】catlass 本项目是CANN的算子模板库&#xff0c;提供NPU上高性能矩阵乘及其相关融合类算子模板样例。 项目地址: https://gitcode.com/cann/catlass 代码组织 ├── 24_conv_bias │ ├── CMakeLists.txt # CMake编译文…

作者头像 李华
网站建设 2026/5/9 15:41:31

LLM 模型图模式改造指南

LLM 模型图模式改造指南 【免费下载链接】cannbot-skills CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体&#xff0c;本仓库为其提供可复用的 Skills 模块。 项目地址: https://gitcode.com/cann/cannbot-skills 本文档专门针对 LLM 推理模型 的图模式适配&am…

作者头像 李华
网站建设 2026/5/9 15:41:29

CANN NPU压缩算子文档

Compressor 【免费下载链接】cann-recipes-infer 本项目针对LLM与多模态模型推理业务中的典型模型、加速算法&#xff0c;提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-infer 产品支持情况 产品是否支持Atlas A3 推理系列产品√ 功能…

作者头像 李华
网站建设 2026/5/9 15:41:29

从零构建量化交易系统:架构、策略与实盘部署全解析

1. 项目概述&#xff1a;当开发者决定“击败市场”如果你是一个对金融市场、量化交易或者自动化策略感兴趣的开发者&#xff0c;那么你很可能和我一样&#xff0c;曾经有过一个想法&#xff1a;能不能写个程序&#xff0c;让它自动帮我分析市场、执行交易&#xff0c;甚至“击败…

作者头像 李华