news 2026/5/10 3:33:42

CANN/catlass Swizzle策略说明

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/catlass Swizzle策略说明

Swizzle策略说明

【免费下载链接】catlass本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass

Swizzle策略决定了AI Core计算基本块的顺序。调整Swizzle策略有助于提高缓存命中率、减小数据读取开销,从而提高矩阵乘整体计算效率。

下方展示了3种Swizzle策略。图中每一个方块表示C矩阵的一个基本块,方块中的序号代表AI Core的编号(该示例中假设AI Core数量为20)。箭头方向指示了特定Swizzle策略下基本块的遍历顺序,我们按照该顺序将基本块依次分配给AI Core进行处理,编号0~19的20个基本块是并行计算的。

示例1

默认的Swizzle策略为SwizzleOffset=1、SwizzleDirection=0,即:

using BlockScheduler = typename Gemm::Block::GemmIdentityBlockSwizzle<>;

示例2

SwizzleOffset=3、SwizzleDirection=0

using BlockScheduler = typename Gemm::Block::GemmIdentityBlockSwizzle<3, 0>;

示例3

SwizzleOffset=3、SwizzleDirection=1

using BlockScheduler = typename Gemm::Block::GemmIdentityBlockSwizzle<3, 1>;

Swizzle策略选择

如果C矩阵的大小为M x N,那么当M >= N时,采用SwizzleOffset=3、SwizzleDirection=0,通常情况下能够达到较好的性能;当M < N时,采用SwizzleOffset=3、SwizzleDirection=1,通常情况下可以达到较好的性能。开发者也可以探索其他参数设置以达到更高的缓存命中率,从而进一步提高矩阵计算性能。

【免费下载链接】catlass本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/10 3:31:37

基于Mirai与Spring Boot的QQ机器人开发实战:从零构建PCR公会战管理工具

1. 项目缘起与重生之路 作为一个在QQ机器人圈子里摸爬滚打了快十年的老玩家&#xff0c;我见证过不少框架的兴起与沉寂。最早自己捣鼓着用酷Q和PicqBotX框架&#xff0c;整合Spring写了个叫WMagicBot的小玩意儿&#xff0c;纯粹是自娱自乐。后来酷Q一夜之间停止服务&#xff0…

作者头像 李华
网站建设 2026/5/10 3:30:32

大语言模型与通用人工智能的差距:从概念理解到知行合一

1. 项目概述&#xff1a;我们离真正的“智能”还有多远&#xff1f;最近和几个做AI的朋友聊天&#xff0c;大家都有一个共同的感受&#xff1a;大语言模型&#xff08;LLM&#xff09;确实火&#xff0c;ChatGPT、Claude这些工具用起来也足够惊艳&#xff0c;能写代码、能写诗、…

作者头像 李华
网站建设 2026/5/10 3:29:32

CANN/ops-transformer注意力融合算子

AttentionWorkerCombine 【免费下载链接】ops-transformer 本项目是CANN提供的transformer类大模型算子库&#xff0c;实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-transformer 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DTAtlas A3 训…

作者头像 李华
网站建设 2026/5/10 3:29:31

CANN/catlass Epilogue适配开发指南

Epilogue适配与开发详解 【免费下载链接】catlass 本项目是CANN的算子模板库&#xff0c;提供NPU上高性能矩阵乘及其相关融合类算子模板样例。 项目地址: https://gitcode.com/cann/catlass 1. Epilogue概述 Epilogue是矩阵乘法&#xff08;GEMM&#xff09;计算的最后…

作者头像 李华
网站建设 2026/5/10 3:27:59

对比自行维护API中转与使用Taotoken在稳定性上的体感差异

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 对比自行维护API中转与使用Taotoken在稳定性上的体感差异 对于需要频繁调用大模型API的开发者而言&#xff0c;服务的稳定性是保障…

作者头像 李华
网站建设 2026/5/10 3:26:46

面板波浪力人工神经网络预测与鲸鱼算法优化【附程序】

✨ 本团队擅长数据搜集与处理、建模仿真、程序设计、仿真代码、EI、SCI写作与指导&#xff0c;毕业论文、期刊论文经验交流。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流&#xff0c;点击《获取方式》 &#xff08;1&#xff09;自适应鲸鱼优化算法驱动的双向长短期记忆网络架构&…

作者头像 李华