news 2026/4/16 12:55:33

【Triton 教程】triton_language.store

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【Triton 教程】triton_language.store

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。

更多 Triton 中文文档可访问 →triton.hyper.ai/

triton.language.store(pointer, value, mask=None, boundary_check=(), cache_modifier='', eviction_policy='')

将数据张量存储到由指针定义的内存位置。

1.如果pointer是单元素指针,则加载 1 个标量。在这种情况下:

  • mask必须是标量,
  • boundary_checkpadding_option必须为空。

2.如果pointer是 1 个 N 维指针张量,则会存储 1 个 N 维张量。在这种情况下:

  • mask会被隐式地广播到pointer.shape
  • boundary_check必须为空。

3.如果pointer是由make_block_ptr定义的块指针,则会存储 1 个张量。在这种情况下:

  • mask必须为None
  • 可以指定boundary_check以控制越界访问的行为。

value会被隐式地广播为pointer.shape,并转换为pointer.element_ty类型。

参数**:**

  • pointer(triton.PointerType, 或 dtype=triton.PointerType 的块) - 存储 value 元素的内存位置。
  • value(Block) - 要存储的元素张量。
  • masktriton.int1 的块,可选)- 如果 mask[idx] 为 false,则不将 value[idx] 存储在 pointer[idx] 处。
  • boundary_check整数元组,可选)- 整数元组,表示应该进行边界检查的维度。
  • cache_modifier(str,可选,应为 {“”(空字符串)、“.wb”(表示缓存回写所有一致性层级)、“.cg”(表示全局缓存)、“.cs”(表示缓存流)、“.wt”(表示缓存直写)} 中的一个)更多详情请参见缓存操作符)—— 在 NVIDIA PTX 中更改缓存选项。
  • eviction_policystr可选应为 {“”, “evict_first”, “evict_last”} 中的一个)- 更改 NVIDIA PTX 中的驱逐策略。

这个函数也可作为tensor的成员函数调用,使用x.store(...)方式而不是store(x, ...)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/12 21:40:18

高效实现国密算法:GMSSL框架下SM2、SM3、SM4的技术整合与应用

SM2、SM3、SM4分别作为我国在公钥密码、哈希函数和对称加密领域的标准算法,构成了国密体系的核心支柱。借助GMSSL库,开发者可在同一技术栈中实现三者的高效集成。下面将从开发环境搭建、核心API调用到常见问题规避,全面解析基于GMSSL实现SM2密…

作者头像 李华
网站建设 2026/4/16 12:09:13

pg_waldump 和 pg_xlogdump

目录标题一句话结论背景:为什么改名?具体对比1️⃣ pg_xlogdump(已废弃)2️⃣ pg_waldump(当前标准)功能层面有没有区别?运维视角(结合你最近在看的 WAL / 复制槽问题)总…

作者头像 李华
网站建设 2026/4/15 21:46:09

mybatis insert后返回id

在 MyBatis 中插入数据后返回自增 ID 有以下几种常用方法&#xff1a;1. 使用 useGeneratedKeys和 keyProperty&#xff08;推荐&#xff09;XML 映射文件方式<insert id"insertUser" parameterType"User" useGeneratedKeys"true" keyPropert…

作者头像 李华
网站建设 2026/4/14 13:38:40

3P游戏动作为何总对不上位移?

你在玩第三人称(3P)射击 / 动作游戏时, 一定见过这种“违和感爆表”的画面: 敌人明明在狂奔,腿跑得飞快,整个人却像在慢动作滑行 模型已经一脚迈出去了,判定还当他站在原地 你看见对面刚停下,马上抬枪瞄他,结果他在你眼里还在跑步动画 有的人“脚下踩着风火轮”,位移…

作者头像 李华