news 2026/4/16 12:40:58

tensorflow 零基础吃透:创建 tf.sparse.SparseTensor 的核心方法

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
tensorflow 零基础吃透:创建 tf.sparse.SparseTensor 的核心方法

零基础吃透:创建tf.sparse.SparseTensor的核心方法

创建tf.sparse.SparseTensor是使用稀疏张量的基础,TensorFlow提供了直接构造从密集张量转换两种核心方式,同时可通过自定义函数美化打印结果(便于调试),也能轻松转回密集张量。以下结合示例拆解每个步骤的原理、用法和注意事项。

一、环境警告说明(先避坑)

代码中出现的GPU相关警告(如cuFFT/cuDNN/cuBLAS factory)是因为本地环境的GPU库重复注册/缺失,不影响稀疏张量的核心功能(CPU环境下可正常运行),无需处理即可继续。

二、方式1:直接构造SparseTensor(核心参数)

2.1 构造原理

直接通过tf.sparse.SparseTensor构造,需指定三个核心参数(COO格式):

参数名要求示例
indices二维张量(dtype=int64),每行是一个非零值的坐标,形状[N, rank][[0,3], [2,4]](2个非零值,二维坐标)
values一维张量,长度=N(与indices行数一致),存储非零值[10,20]
dense_shape一维张量(dtype=int64),指定稀疏张量对应的密集形状,长度=rank[3,10](3行10列的二维张量)

2.2 示例代码

importtensorflowastf# 直接构造稀疏张量st1=tf.sparse.SparseTensor(indices=[[0,3],[2,4]],# 非零值坐标:(0,3)=10,(2,4)=20values=[10,20],# 非零值列表dense_shape=[3,10]# 对应密集张量形状:3行10列)# 原生打印(显示三个核心组件)print("原生打印SparseTensor:")print(st1)

2.3 输出解读

SparseTensor(indices=tf.Tensor( [[0 3] [2 4]], shape=(2, 2), dtype=int64), values=tf.Tensor([10 20], shape=(2,), dtype=int32), dense_shape=tf.Tensor([ 3 10], shape=(2,), dtype=int64))
  • indices:二维int64张量,2行2列(2个非零值,二维坐标);
  • values:一维int32张量,存储2个非零值;
  • dense_shape:一维int64张量,指定密集形状为[3,10]

三、美观打印SparseTensor(调试必备)

原生打印的格式不直观,可自定义函数将“坐标-值”一一对应打印,便于快速理解稀疏张量的内容。

3.1 自定义打印函数原理

遍历indicesvalues,逐个拼接“坐标: 值”的格式,最终输出结构化的字符串。

3.2 示例代码

defpprint_sparse_tensor(st):# 初始化字符串,先打印密集形状s="<SparseTensor shape=%s \n values={"%(st.dense_shape.numpy().tolist(),)# 遍历每个非零值的坐标和值for(index,value)inzip(st.indices,st.values):# 拼接坐标(列表格式)和值s+=f"\n %s: %s"%(index.numpy().tolist(),value.numpy().tolist())returns+"}>"# 美观打印st1print("\n美观打印SparseTensor:")print(pprint_sparse_tensor(st1))

3.3 输出解读

<SparseTensor shape=[3, 10] values={ [0, 3]: 10 [2, 4]: 20}>

直观看到:

  • 稀疏张量对应密集形状是3行10列
  • 非零值位置:(0,3)为10,(2,4)为20;
  • 其余位置均为隐式零值。

四、方式2:从密集张量转换为SparseTensor

4.1 核心函数:tf.sparse.from_dense

自动提取密集张量中的非零值及其坐标,生成对应的SparseTensor(无需手动指定indices/values)。

4.2 示例代码

# 从密集张量创建稀疏张量dense_tensor=[[1,0,0,8],[0,0,0,0],[0,0,3,0]]st2=tf.sparse.from_dense(dense_tensor)# 美观打印转换后的稀疏张量print("从密集张量转换的SparseTensor:")print(pprint_sparse_tensor(st2))

4.3 输出解读

<SparseTensor shape=[3, 4] values={ [0, 0]: 1 [0, 3]: 8 [2, 2]: 3}>
  • 密集张量的非零值:(0,0)=1(0,3)=8(2,2)=3,其余为0;
  • tf.sparse.from_dense自动过滤零值,仅保留非零值的坐标和值。

五、稀疏张量转回密集张量

5.1 核心函数:tf.sparse.to_dense

根据SparseTensor的indices/values/dense_shape,填充非零值,其余位置补0,生成密集张量。

5.2 示例代码

# 稀疏张量转回密集张量st3=tf.sparse.to_dense(st2)print("\n稀疏张量转回的密集张量:")print(st3)

5.3 输出解读

tf.Tensor( [[1 0 0 8] [0 0 0 0] [0 0 3 0]], shape=(3, 4), dtype=int32)

与原始密集张量完全一致,验证了转换的可逆性。

六、关键注意事项(避坑核心)

1. 数据类型要求

  • indicesdense_shape的dtype必须是int64(TensorFlow强制要求,手动指定时若用int32会报错);
  • values的dtype可自定义(int32/float32等),但需与业务场景匹配。

2. 索引格式要求

  • indices的每行长度必须等于dense_shape的长度(即张量的秩):
    • 二维张量的索引是[行, 列](长度2);
    • 三维张量的索引是[深度, 行, 列](长度3)。

3. 显式零值的处理

  • tf.sparse.from_dense会自动过滤隐式零值(未存储的零),但如果密集张量中主动存储0(显式零值),会被保留:
    # 含显式零值的密集张量dense_with_zero=[[1,0,0],[0,0,0],[2,0,3]]st_with_zero=tf.sparse.from_dense(dense_with_zero)print(pprint_sparse_tensor(st_with_zero))# 仅保留1、2、3,过滤0

4. 空张量处理

  • 若密集张量全为0,tf.sparse.from_dense生成的SparseTensor的indicesvalues为空:
    dense_all_zero=[[0,0],[0,0]]st_all_zero=tf.sparse.from_dense(dense_all_zero)print(st_all_zero.indices.numpy())# 空数组 []print(st_all_zero.values.numpy())# 空数组 []

七、核心总结

操作函数/方法核心用途
直接构造稀疏张量tf.sparse.SparseTensor手动指定非零值坐标和值(精准控制)
密集→稀疏tf.sparse.from_dense自动提取非零值,快速生成稀疏张量
稀疏→密集tf.sparse.to_dense还原为密集张量,适配不支持稀疏的算子
美观打印稀疏张量自定义pprint_sparse_tensor函数调试时直观查看非零值的坐标和值

掌握这三种核心操作,就能灵活创建和转换稀疏张量,满足NLP/计算机视觉等场景下的稀疏数据处理需求。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 12:39:43

BetterNCM终极个性化定制:从零打造专属网易云音乐深度改造方案

BetterNCM终极个性化定制&#xff1a;从零打造专属网易云音乐深度改造方案 【免费下载链接】BetterNCM-Installer 一键安装 Better 系软件 项目地址: https://gitcode.com/gh_mirrors/be/BetterNCM-Installer 想要彻底告别千篇一律的音乐播放器界面吗&#xff1f;Better…

作者头像 李华
网站建设 2026/4/16 12:40:40

实验室操作台,选这家技术强!

实验室操作台实验台&#xff1a;选择北京大度空间科技有限公司的技术优势引言在现代科学研究和工业生产中&#xff0c;实验室操作台实验台扮演着至关重要的角色。选择一个技术强大的供应商不仅能提高实验效率&#xff0c;还能确保实验安全和数据准确性。北京大度空间科技有限公…

作者头像 李华
网站建设 2026/4/16 12:40:42

LobeChat部署常见问题汇总及解决方案(2024最新版)

LobeChat部署常见问题汇总及解决方案&#xff08;2024最新版&#xff09; 在构建私有化AI助手的浪潮中&#xff0c;越来越多开发者面临一个共同挑战&#xff1a;如何将强大的大语言模型能力&#xff0c;以安全、高效且用户友好的方式呈现出来&#xff1f;直接调用OpenAI或Claud…

作者头像 李华
网站建设 2026/4/16 7:56:21

终极解决方案:用符号链接技术实现Windows应用无缝迁移

终极解决方案&#xff1a;用符号链接技术实现Windows应用无缝迁移 【免费下载链接】FreeMove Move directories without breaking shortcuts or installations 项目地址: https://gitcode.com/gh_mirrors/fr/FreeMove 你是否曾经面对C盘不断变红的警告而感到无助&#x…

作者头像 李华
网站建设 2026/4/12 7:57:41

Qwen3-32B实测:单卡A100跑出180+吞吐

Qwen3-32B实测&#xff1a;单卡A100跑出180吞吐 你有没有被这样的AI部署难题困扰过&#xff1f;想上大模型&#xff0c;70B的“巨兽”一启动就要四五张A100组集群&#xff0c;电费比工资还高 &#x1f4b8;&#xff1b;而小模型呢&#xff0c;写代码总漏半句&#xff0c;推理像…

作者头像 李华
网站建设 2026/3/30 3:06:06

LobeChat对接AutoGPT插件:实现自主任务执行

LobeChat对接AutoGPT插件&#xff1a;实现自主任务执行 在今天&#xff0c;越来越多的开发者和企业不再满足于让AI“回答问题”&#xff0c;而是希望它能真正“做事”——比如分析一份财报、整理会议纪要、自动生成周报&#xff0c;甚至完成一次完整的市场调研。这种从“被动应…

作者头像 李华