news 2026/6/10 16:43:00

深度学习篇---瓶颈结构残差块

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
深度学习篇---瓶颈结构残差块

瓶颈结构残差块:深度学习中的“精兵简政”

让我用一个工厂生产线的比喻,让你秒懂这个精妙的设计。


核心比喻:高效的生产车间

想象一个处理特征的工厂

  • 输入特征图:一批等待加工的“原材料”。

  • 输出特征图:加工完成的“成品”。

  • 特征通道数:原材料的种类数量。比如256通道 = 有256种不同的原材料。


1. 普通残差块的问题

普通的残差块就像直接加工车间

原材料(256种) → [3×3卷积] → 中间品(256种) → [3×3卷积] → 成品(256种)

问题:两个3×3卷积都要处理256种原材料,计算量巨大

打个比方:有256种水果(苹果、香蕉、橙子...),你要做混合果汁。

  • 普通方法:把256种水果都先粗略混合 → 再精细混合 → 产出256种果汁。

  • 缺点:每次都处理256种,太麻烦了!


2. 瓶颈结构的智慧:三步精炼法

瓶颈结构是“压缩-加工-扩展”流水线

原材料(256种) → [1×1卷积] → 精华液(64种) → [3×3卷积] → 精华液(64种) → [1×1卷积] → 成品(256种) ⬇️ ⬇️ ⬇️ ⬇️ ⬇️ [压缩] [核心处理] [核心处理] [还原] [完成]

第一步:1×1卷积 → 数据“压缩专家”

  • 作用:把256种原材料压缩成64种精华液

  • 原理:1×1卷积就像是挑选和混合专家

    输入:256种水果 过程:专家精心挑选和混合,做成64种基础浓缩液 输出:64瓶高度浓缩的基础液
  • 为什么能压缩

    • 1×1卷积可以学习256→64的最佳线性组合

    • 它判断哪些特征可以合并,哪些不重要可以精简

    • 计算量大减:原本256×256→现在256×64

第二步:3×3卷积 → 核心“特征提取专家”

  • 作用:在浓缩的64种精华液上进行核心的空间特征提取

  • 好处

    之前:专家要在256种杂乱水果中寻找模式 ❌ 现在:专家只需专注处理64种精心准备的浓缩液 ✅
  • 效率提升:64种的处理成本远低于256种!

第三步:1×1卷积 → 数据“扩展专家”

  • 作用:把64种精华液扩展还原成256种成品

  • 原理:逆向的线性组合,加入新的特征维度:

    输入:64瓶浓缩液 过程:专家用这些浓缩液调制出256种不同风味的果汁 输出:256瓶成品果汁

3. 为什么叫“瓶颈”?

看这个形状:

256通道 64通道 64通道 256通道 输入 ────────→ [压缩] ─────→ [核心] ─────→ [扩展] ────────→ 输出 (宽入口) (窄瓶颈) (窄瓶颈) (宽出口)

数据流像通过一个沙漏

  • 入口宽(256)→ 瓶颈窄(64)→ 出口宽(256)

  • “瓶颈”就是那个最窄的64通道部分


4. 数字对比:省了多少计算?

假设输入是56×56像素的特征图:

普通块(两个3×3)计算量

第一个3×3卷积:56×56 × 256×256 × 3×3 ≈ 1.85亿次乘法 第二个3×3卷积:同样 ≈ 1.85亿次 总计:约3.7亿次乘法

瓶颈块(1×1→3×3→1×1)计算量

第一个1×1卷积:56×56 × 256×64 × 1×1 ≈ 0.51亿次 第二个3×3卷积:56×56 × 64×64 × 3×3 ≈ 0.12亿次 第三个1×1卷积:56×56 × 64×256 × 1×1 ≈ 0.51亿次 总计:约1.14亿次乘法

节省了约70%的计算量!这就是为什么ResNet-50(用瓶颈块)虽然比ResNet-34层数多,但计算量并没有按比例暴增。


5. 实际效果:不只是节省计算

方面普通块瓶颈块优势
计算量降低70%✅ 训练更快
参数数量减少✅ 更少内存,不易过拟合
特征提取直接但低效先精炼后处理✅ 质量更高
非线性能力两次ReLU三次ReLU✅ 表达能力更强

关键洞察:瓶颈块不是简单的计算节省,而是:

  1. 强迫网络学习更紧凑的特征表示(压缩时要做选择)

  2. 在低维空间进行核心计算,减少冗余

  3. 扩展时能融合新特征,丰富表达能力


生活中的类比

  1. 写论文

    • 普通:直接写3000字初稿 → 修改3000字 → 完成

    • 瓶颈:先写500字核心提纲 → 精修这500字 → 扩展成3000字论文 ✅

  2. 公司决策

    • 普通:所有256个员工都参与每个决策 → 混乱低效

    • 瓶颈:选出64人核心委员会做决策 → 高效决策 → 传达给全公司 ✅

  3. 厨房做菜

    • 普通:同时处理256种食材 → 容易手忙脚乱

    • 瓶颈:先准备64种基础酱料 → 用酱料烹饪 → 做成256道菜 ✅


总结:为什么瓶颈结构如此成功

核心理念:不要在“粗数据”上做“细活” 解决方案:压缩 → 精细处理 → 扩展 ⬇️ ⬇️ ⬇️ 过滤噪音 专注核心 丰富表达

这就是为什么从ResNet-50开始都用瓶颈块

  • ResNet-18/34:浅层网络,计算量不大,用普通块足够

  • ResNet-50+/101/152:深层网络必须高效,瓶颈块让“深度”变得可行且实用

这种“压缩-处理-扩展”的思想后来被广泛应用于:

  • MobileNet(深度可分离卷积)

  • EfficientNet(复合缩放)

  • Transformer(前馈网络也是类似结构)

一句话记住瓶颈结构“先浓缩精华,再精心加工,最后丰富呈现”——这是深度学习的效率与质量兼顾之道!

计算效率对比表

操作普通残差块瓶颈残差块节省比例
第一层卷积3×3卷积
256→256通道
1×1卷积
256→64通道
75%参数
第二层卷积3×3卷积
256→256通道
3×3卷积
64→64通道
94%参数
第三层卷积1×1卷积
64→256通道
-
总参数量约117万约69万节省41%
总计算量3.7亿次乘加1.14亿次乘加节省69%
内存占用较高较低更移动友好
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/30 15:19:48

【游戏推荐】亲族与猎物 (Kin and Quarry)免安装中文版

类型: 休闲, 挂机, 采矿 链接:https://pan.quark.cn/s/e9bd560bc5c9 游戏简介 一个邪恶的地脉师盗走了你神圣长生树的魔法精华,并把它埋藏在地下深处! 现在,你和你的小族群必须挖掘、开采和探掘,以恢复长…

作者头像 李华
网站建设 2026/5/30 23:58:26

springboot基于微信小程序的旅游线路定制系统_u13nyaer_sf062

一、项目技术介绍 开发语言:Java 框架:springboot JDK版本:JDK1.8 服务器:tomcat7 数据库:mysql 5.7(一定要5.7版本) 数据库工具:Navicat11 开发软件:eclipse/myeclipse/…

作者头像 李华
网站建设 2026/6/10 13:04:22

ArcGISPro水文水资源、水生态与水环境领域应用;流域划分、空间分析、遥感提取、三维淹没模拟、克里格插值、统计建模等

随着全球水资源管理与环境保护需求的日益增长,地理信息系统(GIS)技术已成为水文、水资源、水生态及水环境领域不可或缺的分析工具。ArcGIS Pro作为ESRI推出的新一代桌面GIS平台,集成了强大的数据采集、处理、分析与可视化功能&…

作者头像 李华