news 2026/4/16 16:47:31

Day 43图像数据与显存机制@浙大疏锦行

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Day 43图像数据与显存机制@浙大疏锦行

Day 43 学习笔记:图像数据与显存机制@浙大疏锦行

一、 图像数据基础

  1. 数据形状 (Shape)

    • 结构化数据(样本数, 特征数)

    • 图像数据

      (通道数, 高, 宽)

      PyTorch 默认格式 (Channel First)

      • 灰度图(如 MNIST):通道数 = 1
      • 彩色图(如 CIFAR-10):通道数 = 3 (RGB)
  2. 维度陷阱

    • PyTorch使用(C, H, W)
    • Matplotlib/OpenCV通常使用(H, W, C)
    • 注意:在使用plt.imshow()可视化 PyTorch 张量时,必须先使用np.transposepermute交换维度顺序。

二、 图像神经网络 (MLP) 定义

  1. 展平操作 (Flatten)
    • MLP 全连接层只能接收一维向量。
    • 必须在输入层前使用nn.Flatten()x.view()(C, H, W)拉平为(C×H×W)的一维向量。
  2. Batch Size 与模型定义
    • 模型定义阶段无关nn.Linear等层定义时不涉及 Batch Size。
    • 数据加载阶段相关DataLoader中设置 Batch Size。
    • 前向传播:PyTorch 会自动处理第一维度的 Batch,模型内部计算逻辑不变。

三、 显存 (VRAM) 占用分析

显存不仅仅用来存图片,主要由以下4部分组成:

组成部分说明估算公式 (Float32)
1. 模型参数模型的权重 (Weights) 和偏置 (Bias)参数量 ×× 4 Bytes
2. 梯度反向传播计算出的导数≈≈ 参数量 ×× 4 Bytes
3. 优化器状态优化器更新参数所需的额外信息SGD: 0
Adam: ≈≈ 参数量 ×× 8 Bytes (动量+方差)
4. 中间变量 & 数据输入数据 + 每一层的输出特征图 (Activations)受 Batch Size 影响最大
Batch Size ×× (单样本大小 + 中间层大小)

结论:模型参数和优化器占用是固定的(这也是为什么大模型很难跑起来),而调整 Batch Size 是控制显存占用的主要手段

四、 Batch Size 的选择策略

  1. 显存限制 (OOM)
    • Batch Size 设置过大会导致Out Of Memory
    • 建议从 16, 32, 64 开始尝试,通常设置为显卡最大承载能力的80%左右。
  2. 对训练的影响
    • Batch Size = 1:梯度随机性大,震荡剧烈,难以收敛。
    • Batch Size 较大:利用矩阵并行计算加速;梯度是多个样本的平均值,方向更准,训练更稳定。

@浙大疏锦行

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/12 14:57:18

8、企业网络设计案例分析

企业网络设计案例分析 在全球范围内,许多组织都在考虑采用 Windows 2000 系统,规划未来的 Active Directory,或者已经实施了相关系统。下面以 Kings Vineyards 公司为例,详细介绍企业网络设计的过程。 1. 案例概述 Kings Vineyards 是一家致力于葡萄酒生产和分销的公司,…

作者头像 李华
网站建设 2026/4/16 11:00:05

8、Windows 7:用户账户控制与文件搜索全攻略

Windows 7:用户账户控制与文件搜索全攻略 1. 更改用户账户控制设置 Windows 7 的用户账户控制(User Account Control,UAC)设置能决定软件在外部公司或网站试图更改 Windows 设置时的通知敏感度。你可以根据自身需求调整这些设置,让其他间谍软件和防病毒程序更好地应对潜…

作者头像 李华
网站建设 2026/4/16 15:33:09

14、Internet Explorer 9:高效上网的全方位指南

Internet Explorer 9:高效上网的全方位指南 一、标签页的使用 1. 多标签浏览操作 在 Internet Explorer 9 中,我们可以轻松地进行多标签浏览。首先,显示一个具有不同内容的页面,比如关于希腊的页面。当该页面显示后,右键单击该网页的标签,然后点击“New Tab”。接着,再…

作者头像 李华
网站建设 2026/4/16 12:45:39

13、Windows 10 启动与网络故障排查指南

Windows 10 启动与网络故障排查指南 1. 启动问题排查 在使用 Windows 10 系统时,可能会遇到各种启动问题。下面将详细介绍可能导致启动问题的原因及相应的解决方法。 1.1 硬件变更或更新引发的问题 硬件的变更或更新可能会导致 Windows 10 无法启动。例如,某个组件(如主…

作者头像 李华
网站建设 2026/4/16 13:03:59

15、Windows 10 常见问题解决指南

Windows 10 常见问题解决指南 在使用 Windows 10 系统时,我们常常会遇到各种令人头疼的问题,如浏览器故障、文件关联错误、磁盘权限问题、音频设备异常、系统激活提示和更新失败等。本文将为你详细介绍这些常见问题的解决方法。 一、浏览器相关问题及解决方法 重置 IE11 …

作者头像 李华
网站建设 2026/4/16 11:04:50

Linly-Talker与Google Cloud TTS互操作性测试

Linly-Talker与Google Cloud TTS互操作性测试 在虚拟主播、智能客服和远程教育等场景中,数字人正从技术概念快速走向规模化落地。然而,一个长期困扰开发者的问题是:如何在保证语音自然度的同时,兼顾系统的实时性与部署灵活性&…

作者头像 李华