news 2026/5/9 12:09:30

CANN TensorFlow NPURunConfig试验参数

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN TensorFlow NPURunConfig试验参数

试验参数

【免费下载链接】tensorflowAscend TensorFlow Adapter项目地址: https://gitcode.com/cann/tensorflow

试验参数为调试功能扩展参数,后续版本可能会存在变更,不支持应用于商用产品中。

experimental_config

功能扩展参数,当前暂不建议使用。用户在创建NPURunConfig之前,可以实例化一个ExperimentalConfig类进行功能配置。ExperimentalConfig类的构造函数,请参见ExperimentalConfig构造函数。

jit_compile

模型编译时,选择是优先在线编译算子,还是优先使用已编译好的算子二进制文件。

  • auto(默认值):针对静态shape网络,在线编译算子;针对动态shape网络,优先查找系统中已编译好的算子二进制,如果查找不到对应的二进制,再编译算子。
  • true:在线编译算子,系统根据得到的图信息进行融合及优化,从而编译出运行性能更优的算子。
  • false:优先查找系统中已编译好的算子二进制文件,如果能查找到,则不再编译算子,编译性能更优;如果查找不到,则再编译算子。

[!NOTE]说明 该参数仅限于大型推荐类型网络使用。

配置示例:

config = NPURunConfig(jit_compile="auto")

shape_generalization_mode

当“jit_compile”参数配置为“true”(即在线编译算子的场景)时,可通过此参数配置输入shape的泛化模式。

  • STRICT(默认值):直接使用当前迭代的shape,不进行泛化。
  • FULL:若两次迭代之间的shape发生变化,则将所有轴的shape泛化为-1。
  • ADAPTIVE:若两次迭代之间的shape发生变化,仅将发生变化的轴的shape泛化为-1。新增泛化的轴会触发模型重新编译,因此该配置下模型可能需要多次编译。

[!NOTE]说明 当compile_dynamic_mode配置为True时,首次迭代会将所有输入shape泛化为“-1”,此时shape_generalization_mode的配置将不生效。

配置示例:

config = NPURunConfig(shape_generalization_mode="FULL")

auto_multistream_parallel_mode

该参数仅适用于静态shape图场景,开发者可通过配置此参数开启Cube算子与Vector算子的并行执行,以提升图执行性能。

  • cv:代表开启Cube算子与Vector算子的并行执行功能。
  • None(默认值),即不开启Cube算子与Vector算子的并行执行功能。

[!NOTE]说明

  • 该参数仅限于推荐类型网络的训练场景使用。
  • Cube算子与Vector算子的并行执行功能不可以与多流并发执行功能(通过环境变量ENABLE_DYNAMIC_SHAPE_MULTI_STREAM设置)同时启用。 关于环境变量的详细说明可参见《环境变量参考》。

配置示例:

config = NPURunConfig(auto_multistream_parallel_mode="cv")

【免费下载链接】tensorflowAscend TensorFlow Adapter项目地址: https://gitcode.com/cann/tensorflow

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 12:08:32

深度解析KrkrzExtract:新一代krkrz引擎资源处理架构揭秘

深度解析KrkrzExtract:新一代krkrz引擎资源处理架构揭秘 【免费下载链接】KrkrzExtract The next generation of KrkrExtract 项目地址: https://gitcode.com/gh_mirrors/kr/KrkrzExtract 在视觉小说游戏开发领域,krkrz引擎的xp3资源格式处理一直…

作者头像 李华
网站建设 2026/5/9 12:08:30

CANN/cann-bench:AddRmsNormDynamicQuant算子API描述

AddRmsNormDynamicQuant 算子 API 描述 【免费下载链接】cann-bench 评测AI在处理CANN领域代码任务的能力,涵盖算子生成、算子优化等领域,支撑模型选型、训练效果评估,统一量化评估标准,识别Agent能力短板,构建CANN领域…

作者头像 李华
网站建设 2026/5/9 12:04:31

KrkrzExtract终极指南:三步掌握krkrz引擎资源解包神器

KrkrzExtract终极指南:三步掌握krkrz引擎资源解包神器 【免费下载链接】KrkrzExtract The next generation of KrkrExtract 项目地址: https://gitcode.com/gh_mirrors/kr/KrkrzExtract KrkrzExtract是一款专为krkrz游戏引擎设计的下一代资源处理工具&#x…

作者头像 李华
网站建设 2026/5/9 12:01:32

零基础上手 GPT-Image-2:在 kulaai 上生成第一张 AI 图片的图文教程

在技术领域,我们常常被那些闪耀的、可见的成果所吸引。今天,这个焦点无疑是大语言模型技术。它们的流畅对话、惊人的创造力,让我们得以一窥未来的轮廓。然而,作为在企业一线构建、部署和维护复杂系统的实践者,我们深知…

作者头像 李华
网站建设 2026/5/9 12:00:34

卡梅德生物技术快报|豆科植物遗传转化:紫穗槐 AfRAP2 基因克隆与转化 豆科植物遗传转化技术全流程解析

1 研究背景与问题提出干旱、碱性盐胁迫严重影响植物生长,豆科植物遗传转化是分子育种核心技术。本文基于紫穗槐干旱转录组,克隆 AfRAP2 基因,完成豆科植物遗传转化全流程,实现烟草、山新杨异源过表达,验证其抗逆功能&a…

作者头像 李华
网站建设 2026/5/9 12:00:32

CANN算子Cumsum测试报告

【免费下载链接】cann-competitions 本仓库用于 CANN 开源社区各类竞赛、开源课题、社区任务等课题发布、开发者作品提交和展示。 项目地址: https://gitcode.com/cann/cann-competitions 元信息(请如实填写,此区块将由组委会脚本自动解析&#xf…

作者头像 李华