news 2026/5/9 12:12:24

CANN/ops-solver Sgetrf算子测试

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ops-solver Sgetrf算子测试

Sgetrf算子实现

【免费下载链接】ops-solver本项目是CANN提供的高级数值求解算子库,实现矩阵分解、求逆、特征值求解等功能在NPU上的加速计算。项目地址: https://gitcode.com/cann/ops-solver

概述

Solver Sgetrf算子实现。

支持的产品

  • Atlas A3 训练系列产品/Atlas A3 推理系列产品
  • Atlas A2 训练系列产品/Atlas A2 推理系列产品

目录结构介绍

├── sgetrf │ ├── CMakeLists.txt // 编译工程文件 │ ├── README.md // 说明文档 │ ├── sgetrf_test.cpp // 算子调用样例 │ └── data // 测试数据目录 │ ├── gen_data.py // 生成测试数据脚本 │ └── verify_result.py // 验证结果脚本

算子描述

  • 算子功能: Sgetrf算子对实数矩阵进行LU分解,对应的数学表达式为: $$A = P \cdot L \cdot U$$ 其中$A$为$m \times n$阶实数矩阵,$P$为置换矩阵,$L$为单位下三角矩阵,$U$为上三角矩阵。

  • 算子规格:

    算子类型(OpType)Sgetrf
    算子输入nameshapedata typeDescriptionformat
    m[1]INT64矩阵A的行数\
    n[1]INT64矩阵A的列数\
    A[m, n]FLOAT32输入矩阵A,行主序ND
    lda[1]INT64A左右相邻元素间的内存地址偏移量(当前约束为N)\
    算子输出A[m, n]FLOAT32输出的L和U矩阵,L和U合并存储在A中ND
    ipiv[min(m,n)]INT32置换矩阵的pivot信息ND
    info[1]INT32分解结果信息\
    核函数名sgetrf_kernel
  • 算子约束:无。

  • 调用实现 使用内核调用符<<<>>>调用核函数。

编译运行

在本样例根目录下执行如下步骤,编译并执行算子。

  • 配置环境变量 请根据当前环境上CANN开发套件包的安装方式,选择对应配置环境变量的命令。

    • 默认路径,root用户安装CANN软件包

      source /usr/local/Ascend/cann/set_env.sh
    • 默认路径,非root用户安装CANN软件包

      source $HOME/Ascend/cann/set_env.sh
    • 指定路径install_path,安装CANN软件包

      source ${install_path}/cann/set_env.sh
  • 样例执行

    bash build.sh --ops=sgetrf --run # --ops=<算子名> --run可选参数,执行测试样例

    执行结果如下,说明精度对比成功。

    [Success] Case accuracy is verification passed.

【免费下载链接】ops-solver本项目是CANN提供的高级数值求解算子库,实现矩阵分解、求逆、特征值求解等功能在NPU上的加速计算。项目地址: https://gitcode.com/cann/ops-solver

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 12:11:35

音视频开发 5.8 摘要 转自b站 总结,建议看视频

原文地址&#xff1a;音视频入门系列-音视频基础知识篇&#xff08;音视频播放原理&#xff09;_哔哩哔哩_bilibili 如果是本地播放&#xff0c;则不需要解协议。 YUV和RGB格式如下&#xff1a; 如YUV444 YUV422 YUV420 其中YUV444刚好是1:1:1&#xff0c;422是YU或者YV&#…

作者头像 李华
网站建设 2026/5/9 12:11:34

CANN/hccl参数面建链故障诊断

参数面建链阶段 【免费下载链接】hccl 集合通信库&#xff08;Huawei Collective Communication Library&#xff0c;简称HCCL&#xff09;是基于昇腾AI处理器的高性能集合通信库&#xff0c;为计算集群提供高性能、高可靠的通信方案 项目地址: https://gitcode.com/cann/hcc…

作者头像 李华
网站建设 2026/5/9 12:09:30

CANN TensorFlow NPURunConfig试验参数

试验参数 【免费下载链接】tensorflow Ascend TensorFlow Adapter 项目地址: https://gitcode.com/cann/tensorflow 试验参数为调试功能扩展参数&#xff0c;后续版本可能会存在变更&#xff0c;不支持应用于商用产品中。 experimental_config 功能扩展参数&#xff0…

作者头像 李华
网站建设 2026/5/9 12:08:32

深度解析KrkrzExtract:新一代krkrz引擎资源处理架构揭秘

深度解析KrkrzExtract&#xff1a;新一代krkrz引擎资源处理架构揭秘 【免费下载链接】KrkrzExtract The next generation of KrkrExtract 项目地址: https://gitcode.com/gh_mirrors/kr/KrkrzExtract 在视觉小说游戏开发领域&#xff0c;krkrz引擎的xp3资源格式处理一直…

作者头像 李华
网站建设 2026/5/9 12:08:30

CANN/cann-bench:AddRmsNormDynamicQuant算子API描述

AddRmsNormDynamicQuant 算子 API 描述 【免费下载链接】cann-bench 评测AI在处理CANN领域代码任务的能力&#xff0c;涵盖算子生成、算子优化等领域&#xff0c;支撑模型选型、训练效果评估&#xff0c;统一量化评估标准&#xff0c;识别Agent能力短板&#xff0c;构建CANN领域…

作者头像 李华
网站建设 2026/5/9 12:04:31

KrkrzExtract终极指南:三步掌握krkrz引擎资源解包神器

KrkrzExtract终极指南&#xff1a;三步掌握krkrz引擎资源解包神器 【免费下载链接】KrkrzExtract The next generation of KrkrExtract 项目地址: https://gitcode.com/gh_mirrors/kr/KrkrzExtract KrkrzExtract是一款专为krkrz游戏引擎设计的下一代资源处理工具&#x…

作者头像 李华