CANN/pyasc矩阵乘法全迭代API-编程阁

asc.language.adv.Matmul.iterate_all

【免费下载链接】pyasc本项目为Python用户提供算子编程接口，支持在昇腾AI处理器上加速计算，接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

Matmul.iterate_all(tensor: BaseTensor, en_atomic: int = 0, sync: bool = True, en_sequential_write: bool | None = None, wait_iterate_all: bool | None = None, fake_msg: bool | None = None) → None

调用一次iterate_all，会计算出singleCoreM * singleCoreN大小的C矩阵。

对应的Ascend C函数原型

template <bool sync = true> __aicore__ inline void IterateAll(const GlobalTensor<DstT>& gm, uint8_t enAtomic = 0, bool enSequentialWrite = false, bool waitIterateAll = false, bool fakeMsg = false)

template <bool sync = true> __aicore__ inline void IterateAll(const LocalTensor<DstT>& ubCmatrix, uint8_t enAtomic = 0)

参数说明

tensor: C矩阵，类型为GlobalTensor或LocalTensor。
en_atomic: 是否开启Atomic操作，默认值为0。
sync: 设置同步或者异步模式。
en_sequential_write: 是否开启连续写模式，仅支持输出到Global Memory场景。
wait_iterate_all: 是否需要通过wait_iterate_all接口等待iterate_all执行结束，仅支持异步输出到Global Memory场景。
fake_msg: 仅在IBShare场景和IntraBlockPartSum场景使用，仅在支持输出到Global Memory场景。

约束说明

传入的C矩阵地址空间大小需要保证不小于single_core_m * single_core_n个元素。

调用示例

asc.adv.register_matmul(pipe, workspace, mm, tiling) mm.set_tensor_a(gm_a) mm.set_tensor_b(gm_b) mm.set_bias(gm_bias) mm.iterate_all(gm_c)

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

鸣潮自动化工具ok-ww：3大核心功能助你告别重复刷本烦恼

鸣潮自动化工具ok-ww：3大核心功能助你告别重复刷本烦恼【免费下载链接】ok-wuthering-waves 鸣潮后台自动战斗自动刷声骸一键日常 Automation for Wuthering Waves 项目地址: https://gitcode.com/GitHub_Trending/ok/ok-wuthering-waves 你是否厌倦了在…

李华

互联网大厂 Java 求职面试：音视频场景中的 Java 技术栈

互联网大厂 Java 求职面试：音视频场景中的 Java 技术栈在今天的面试中，面试官将与搞笑的求职者燕双非进行一轮紧张而又趣味的技术问答。第一轮提问：音视频技术基础面试官：燕双非，首先请你谈谈 Java SE 8 的一些新特性&…

李华

CANN/catlass 3D卷积偏置算子示例

ConvBias Example Readme 【免费下载链接】catlass 本项目是CANN的算子模板库，提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass 代码组织 ├── 24_conv_bias │ ├── CMakeLists.txt # CMake编译文…

李华

LLM 模型图模式改造指南

LLM 模型图模式改造指南【免费下载链接】cannbot-skills CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。项目地址: https://gitcode.com/cann/cannbot-skills 本文档专门针对 LLM 推理模型的图模式适配&am…

李华

CANN NPU压缩算子文档

Compressor 【免费下载链接】cann-recipes-infer 本项目针对LLM与多模态模型推理业务中的典型模型、加速算法，提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-infer 产品支持情况产品是否支持Atlas A3 推理系列产品√ 功能…

李华

从零构建量化交易系统：架构、策略与实盘部署全解析

1. 项目概述：当开发者决定“击败市场”如果你是一个对金融市场、量化交易或者自动化策略感兴趣的开发者，那么你很可能和我一样，曾经有过一个想法：能不能写个程序，让它自动帮我分析市场、执行交易，甚至“击败…

李华