news 2026/5/9 13:18:50

华为CANN/ops-cv广播关系详解

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
华为CANN/ops-cv广播关系详解

broadcast关系

【免费下载链接】ops-cv本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-cv

广播概念

broadcast(广播)描述了算子在运算期间如何处理不同形状的张量(或数组)。大部分情况下,允许不同形状的张量(或数组)在进行元素操作时自动扩展其形状,使其维度相互兼容,通常较小的张量(或数组)会“广播”为较大的张量(或数组)。

目前许多CANN算子API参数shape支持广播,可适当提高计算效率、减少内存占用(尤其大规模数据场景),更详细的广播技术介绍请参考NumPy官网。

广播规则

一般进行广播计算时,需要理解以下规则:

  • 规则1:如果数组间维度数不一致,所有数组向最长形状的数组看齐,形状不足的部分在左侧填充1,直至维度数相同。

    说明:

    • 举例1:维度数(Number of Dimensions)是指张量(或数组)对应shape的维数,比如x.shape=(1,1,2,4),维度数是4 。
    • 举例2:比如计算a+b,其中a.shape=(2, 2, 3)、b.shape=(2, 3),那么数组b将被broadcast为b.shape=(1, 2, 3)。
  • 规则2:如果数组间维度数一致,且某个数组的某一维度为1,则该维度为1的数组将被拉伸以匹配另一个数组对应维度形状。

    说明: 本场景下,只需保证在某一维度做broadcast即可。比如计算a+b,其中a.shape=(1, 3)、b.shape=(3, 1),那么两个数组会broadcast为a.shape=(3, 3)、b.shape=(3, 3)。

  • 规则3:如果数组间维度数不一致,且均没有等于1的维度,则会报错。

基于上述规则,广播过程一般先按规则1进行扩维,再按规则2进行形状拉伸,具体例子如下:

假设a.shape=(2,2,3),取值形如: [[[1 2 3],[4 5 6]], [[1 2 3],[4 5 6]]] 假设b.shape=(2,3),取值形如: [[1 2 3], [-1 -2 -3]] 根据规则1扩展维度,b.shape=(1,2,3),取值如下: [[[1 2 3], [-1 -2 -3]]] 根据规则2拉伸形状,b.shape=(2,2,3),取值如下: [[[1 2 3],[-1 -2 -3]], [[1 2 3],[-1 -2 -3]]] 计算a+b,实际结果如下: [[[2 4 6],[3 3 3]], [[2 4 6],[3 3 3]]]

限制

当满足broadcast关系的两个输入a和b的数据类型或推导后的数据类型在COMPLEX64、COMPLEX128、DOUBLE、INT16、UINT16、UINT64中时,除了满足上述广播规则,还需满足如下条件,否则广播会失败,导致算子执行报错。 条件:连续的需要广播的轴和连续的不需要广播的轴合并之后的维度要求小于6。 举例:

  • 当a.shape=(5, 1, 5, 1, 5, 1),b.shape=(5, 5, 5, 5, 5, 5),没有需要合并的轴,最后维度为6,广播报错。
  • 当a.shape=(5, 1, 5, 5, 1, 1),b.shape=(5, 5, 5, 5, 5, 5),在第2和3维都不需要广播,4和5维都需要广播,分别连续合并,合并后的维度为4,广播成功。

【免费下载链接】ops-cv本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-cv

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 13:18:50

云边端协同空间智能架构,构筑智慧港口低时延、高可靠实时算力底座

云边端协同空间智能架构,构筑智慧港口低时延、高可靠实时算力底座副标题:边缘端实时重构 云端全局调度,满足港区毫秒级态势感知与决策响应一、技术应用背景与行业算力瓶颈智慧港口全域数字化、智能化升级进程中,全域空间感知、三…

作者头像 李华
网站建设 2026/5/9 13:18:48

空间智能优化作业链路,赋能智慧港口降本、提效、减碳三重价值升级

空间智能优化作业链路,赋能智慧港口降本、提效、减碳三重价值升级副标题:智能路径规划 泊位智能编排,减少集卡空驶等待,提升港区周转效能一、行业背景与核心痛点大型枢纽港口作为物流集散核心枢纽,作业链路冗长、环节…

作者头像 李华
网站建设 2026/5/9 13:16:29

统好 AI 采购管理:全流程数字化精益管控

在企业供应链运营中,采购业务链条长、单据多、流程杂,很容易出现预算失控、单据流转繁琐、对账复杂、成本难以分析等问题。绵阳统好软件有限公司旗下的统好 AI,依托自研采购管理模块,搭建起从采购需求发起、寻源计划、业务执行、物…

作者头像 李华
网站建设 2026/5/9 13:14:40

2026年荆州成人AI学习口碑好机构揭秘

在当今数字化时代,AI已成为推动各行业发展的核心力量。对于荆州的成人学习者来说,找到一家靠谱且口碑良好的AI学习机构至关重要。炽培星AIGC产业赋能基地凭借其卓越的教学质量、全面的服务体系和显著的成果,在众多机构中脱颖而出,…

作者头像 李华
网站建设 2026/5/9 13:13:33

CANN运行时跨机内存共享

12_cross_server_physical_memory_sharing_withoutpid 【免费下载链接】runtime 本项目提供CANN运行时组件和维测功能组件。 项目地址: https://gitcode.com/cann/runtime 描述 本样例展示了 aclrtMemExportToShareableHandleV2 和 aclrtMemImportFromShareableHandleV…

作者头像 李华
网站建设 2026/5/9 13:11:49

AI赋能空间天气预报:深度学习预测太阳耀斑的技术实践

1. 项目概述:当AI遇见太阳风暴太阳,这颗为我们提供光和热的恒星,其表面并非总是宁静。剧烈的太阳活动,尤其是太阳耀斑和日冕物质抛射,会向太空抛射出大量高能粒子和辐射。当这些“太阳风暴”抵达地球时,会对…

作者头像 李华