news 2026/5/9 16:17:34

CANN/catlass: Gemm/Kernel类模板概述

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/catlass: Gemm/Kernel类模板概述

Gemm/Kernel 类模板概述

【免费下载链接】catlass本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass

API 清单

组件名描述
basic_matmulCommon模板基础矩阵乘
basic_matmul_tla_visitorEVG 的 GM workspace kernel 入口
basic_matmul_tla_ub_visitorEVG 的 UB workspace kernel 入口

API 拆解

命名空间为Catlass::Gemm::Kernel,类模板包含如下核心成员:

类型名称功能
structParamskernel通过<<<>>>>调用核函数时的入参
structArgumentsdevice封装后kernel后使用的入参
静态函数bool CanImplementArguments校验接口
静态函数size_t GetWorkspaceSize基于Arguments计算需要的workSpaceSize
静态函数Params ToUnderlyingArguments将Arguments转换为核函数入参Params
函数void operator()<AscendC::AIC>输入Params,完成AIC上mmad计算
函数void operator()<AscendC::AIV>输入Params,完成AIV上计算,如前处理、尾处理等

【免费下载链接】catlass本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 16:14:31

CANN/ge图编译公共基础结构约束文档

图编译公共基础结构约束文档 【免费下载链接】ge GE&#xff08;Graph Engine&#xff09;是面向昇腾的图编译器和执行器&#xff0c;提供了计算图优化、多流并行、内存复用和模型下沉等技术手段&#xff0c;加速模型执行效率&#xff0c;减少模型内存占用。 GE 提供对 PyTorch…

作者头像 李华
网站建设 2026/5/9 15:59:07

Godot文档仓库深度解析:从源码构建到高效使用的完整指南

1. 从源码到手册&#xff1a;Godot文档仓库深度解析 如果你正在使用Godot引擎&#xff0c;无论是刚入门的新手&#xff0c;还是正在开发复杂项目的资深开发者&#xff0c;都离不开一份准确、详实的官方文档。我们每天访问的 docs.godotengine.org 网站&#xff0c;其背后并非…

作者头像 李华
网站建设 2026/5/9 15:57:31

大模型对齐技术:从RLHF到DPO的演进与实践

1. 大模型对齐技术发展脉络大模型对齐&#xff08;Alignment&#xff09;技术是确保AI系统行为与人类价值观和意图保持一致的关键领域。过去几年里&#xff0c;我们见证了从基于强化学习的RLHF方法到更高效直接的DPO技术的演进过程。这种转变不仅仅是技术路线的优化&#xff0c…

作者头像 李华
网站建设 2026/5/9 15:55:59

开源量化框架trading-strategy:DeFi链上策略开发与回测实战指南

1. 项目概述与核心价值最近在量化交易和算法策略开发的圈子里&#xff0c;一个名为tradingstrategy-ai/trading-strategy的开源项目热度持续攀升。作为一名在金融科技和自动化交易领域摸爬滚打了十多年的老兵&#xff0c;我习惯性地会去审视每一个新出现的“明星项目”&#xf…

作者头像 李华