news 2026/5/9 22:02:41

CANN/hixl CacheDesc类文档

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/hixl CacheDesc类文档

CacheDesc

【免费下载链接】hixlHIXL(Huawei Xfer Library)是一个灵活、高效的昇腾单边通信库,面向集群场景提供简单、可靠、高效的点对点数据传输能力。项目地址: https://gitcode.com/cann/hixl

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

说明:针对Atlas A2 训练系列产品/Atlas A2 推理系列产品,仅支持Atlas 800I A2 推理服务器、A200I A2 Box 异构组件。

函数功能

构造CacheDesc,通常在CacheManager的allocate_cache接口中作为参数类型使用。

函数原型

__init__(self, num_tensors: int, shape: Union[Tuple[int], List[int]], data_type: DataType, placement: Placement = Placement.DEVICE, batch_dim_index: int = 0, seq_len_dim_index: int = -1, kv_tensor_format: str = None)

参数说明

参数名称数据类型取值说明
num_tensorsintcache中tensor的个数,操作cache时,所有tensor会做同样的操作。
shapeUnion[Tuple[int], List[int]]tensor的shape。
data_typeDataTypetensor的data type。
placementPlacement表示cache所在的设备类型。默认值Placement.DEVICE。
batch_dim_indexint表示shape中batch size所在维度。默认值0,表示在第0维。
seq_len_dim_indexint表示shape中seq_len所在维度。默认值-1,表示未配置。
kv_tensor_formatstr表示cache的format。默认不配置。

调用示例

from llm_datadist import CacheDesc cache_desc = CacheDesc(80, [4, 2048, 1, 128], DataType.DT_FLOAT16)

返回值

正常情况下返回CacheDesc的实例。

传入数据类型错误情况下会抛出TypeError或ValueError异常。

约束说明

【免费下载链接】hixlHIXL(Huawei Xfer Library)是一个灵活、高效的昇腾单边通信库,面向集群场景提供简单、可靠、高效的点对点数据传输能力。项目地址: https://gitcode.com/cann/hixl

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 22:02:40

CANN/opbase SetData函数文档

SetData 【免费下载链接】opbase 本项目是CANN算子库的基础框架库,为算子提供公共依赖文件和基础调度能力。 项目地址: https://gitcode.com/cann/opbase 功能说明 针对通过AllocHostTensor申请得到的host侧tensor,设置指定位置的数据。 函数原…

作者头像 李华
网站建设 2026/5/9 21:56:55

基于3D骨架与GCN的神经退行性疾病步态AI诊断技术解析

1. 项目概述:当AI“读懂”你的步伐在神经退行性疾病的漫长诊疗历程中,医生们一直在寻找更客观、更早期、更敏感的评估工具。传统的诊断,很大程度上依赖于医生的经验观察和患者的主观描述,比如“走路是不是比以前慢了?”…

作者头像 李华
网站建设 2026/5/9 21:56:20

AI编程助手试用机制解析:从环境重置到授权验证的技术实践

1. 项目概述:当AI编程助手遇上“试用”难题如果你是一名开发者,最近肯定没少听说Cursor这个名字。它已经不是那个简单的代码编辑器了,而是集成了强大AI能力的编程伙伴,尤其是其Pro版本,能提供更长的上下文、更快的响应…

作者头像 李华
网站建设 2026/5/9 21:56:19

CANN/ops-nn LogSoftmax算子文档

aclnnLogSoftmax 【免费下载链接】ops-nn 本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-nn 📄 查看源码 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系…

作者头像 李华
网站建设 2026/5/9 21:54:39

Cosmos-predict2.5-2B视频生成具身智能世界模型昇腾使用指南

Cosmos-predict2.5-2B视频生成具身智能世界模型昇腾使用指南 【免费下载链接】cann-recipes-embodied-intelligence 本项目针对具身智能业务中的典型模型、加速算法,提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-embodied-intell…

作者头像 李华