IVIF文献阅读笔记：SSDFusion: A scene-semantic decomposition approach for visible and infrared image fusion-编程阁

1、题目

2、文献信息

3、动机

4、主要工作

5、核心创新点

6、网络结构

1）总体架构

2)SSDFusion 的整体框架

3）提出的两阶段训练策略，设计了相应的多级损失函数

1、题目

SSDFusion: A scene-semantic decomposition approach for visible and infrared image fusion

SSDFusion：一种用于可见光与红外图像融合的场景语义分解方法

2、文献信息

作者：雷明亚、肖一贤、刘新宇、郑国龙、肖国宝*

出处：PATTERN RECOGNITION，2025(163)111457

IF：7.6，JCR分区：Q1，新锐分区：计算机科学1区

链接：SSDFusion: A scene-semantic decomposition approach for visible and infrared image fusion - ScienceDirect

3、动机

现有方法难以充分处理不同模态间的特征关系，导致跨模态特征提取不足；像素级融合策略主要关注图像质量提升，通常忽略场景信息与语义上下文的互补作用，导致在下游任务中表征性能不佳；下游任务中表征性能不佳

4、主要工作

1）提出了名为SSDFusion的新型可见光与红外图像场景-语义分解与融合框架

2）构建了多级编码器-融合网络，分别提取并融合场景相关与语义相关特征，并将融合后的语义特征注入场景特征中以丰富上下文信息

3）引入元特征嵌入（Meta-feature embedding）机制，在训练阶段将融合网络与下游应用（如语义分割）的骨干网络相连接，以优化融合效果并提升下游任务性能。在MSRS、FMB等数据集上进行了广泛实验验证

5、核心创新点

1）场景-语义特征分解与融合策略：采用Transformer提取全局场景特征，CNN提取局部语义特征，并通过SPADE机制将语义特征动态注入场景特征

2)多级编码器-融合架构：构建与下游应用骨干网络层级对齐的多级网络，实现多尺度的特征提取与特征指导

3)元特征嵌入模块（MFEM）：模拟元学习机制，利用下游任务特征直接微调和监督融合网络中的语义分支

6、网络结构

1）总体架构

2)SSDFusion的整体框架

SSDFusion的整体由多级编码器-融合网络、图像重建解码器以及用于连接下游骨干网络的元特征嵌入模块（MFEM）组成

多级编码器-融合网络(Multi-Level Encoder-Fusion Network)

特征编码器(Coarse Feature Encoder)：采用多级结构提取源图像特征。第一层输入可见光与红外图像，使用基于Restormer的特征提取块(RCEB)提取全局特征。为平衡计算成本，后续两层采用基于MSCA的特征提取块(MCEB)获取多尺度局部上下文信息

场景-语义分解与融合模块(SDFM)：在每一层接收粗特征，将其分解为场景分支和语义分支并进行独立融合。随后利用空间自适应归一化(SPADE)将融合后的语义特征动态注入场景特征中，输出多尺度融合特征

元特征嵌入模块(MFEM)

在训练阶段的元特征嵌入环节，MFEM将融合网络的各个层级与下游应用骨干网络（Downstream Backbone Network）的对应层相连接

利用下游骨干网络提取的特征引导和微调SDFM提取的语义特征，实现下游任务特征对融合网络语义提取的监督与优化

图像重建解码器(Image Reconstruction Decoder)

接收来自多级融合网络的融合特征，首先通过空洞残差密集块(DRDB)增强多级特征的表示能力，随后经过上采样并利用1×1卷积聚合多级特征，送入Restormer块进行解码，最终通过卷积层和Sigmoid激活函数生成高质量的融合图像

3）提出的两阶段训练策略，设计了相应的多级损失函数

图像重建与融合学习阶段

元特征嵌入阶段

第2讲：主流Agent框架选型与对比——告别“造轮子”，站在巨人的肩膀上

欢迎来到《Python AI Agent 实战开发完全指南》专栏！ 在上一讲中，我们用原生 Python 手搓了一个基础的 Agent。但在真实的工程落地中，如果所有的意图识别、工具解析、状态流转都由我们自己手写，不仅开发效率低，还容易…

李华

论鸿蒙数学108篇第七阶，用东方“七星动态变化周期”重构现代数学：解析几何与AI算法的终极本源

论鸿蒙数学第七阶的内核价值与现实应用摘要鸿蒙数学循一元→两仪→三才→四象→五行→六合→七星的先天道统脉络逐级升维，前六阶搭建起宇宙静态数理骨架与空间体系，第七阶以七星周期为核心，完成了从静态数理到动态节律、分立体系到数形合一的…

李华

Elastic Agent独立模式实战：手把手教你从Kibana配置到Nginx日志采集（macOS版）

Elastic Agent独立模式实战：macOS下Nginx日志采集全流程指南在数据驱动的运维时代，日志采集与分析已成为技术团队的基础能力。对于macOS环境下的开发者或运维人员而言，当Fleet管理不可行时，独立模式下的Elastic Agent提供了一种灵…

李华

Python调用C# DLL实战：用clr库搞定工业协议库IEC61850Library的完整流程

Python与C#深度整合：工业协议库IEC61850的高效调用实战工业自动化领域长期存在一个技术痛点：大量核心协议库以C#/.NET技术栈封装，而现代数据分析与AI应用又普遍采用Python生态。如何打通这两种技术体系？本文将手把手带你用Python的…

李华

Web 安全：路径遍历（Path Traversal）攻防全解析

一、漏洞定义与危害路径遍历（也常称目录遍历，Directory Traversal）是 Web 应用中高危文件操作类漏洞。攻击者可利用该缺陷绕过服务端目录访问控制规则，读取服务器文件系统内任意文件，部分场景下还能结合写入权限实现权…

李华

从安装到跑通第一个程序：IDEA 2021.3.2 新手指南（含项目结构解析与.class文件位置查找）

从安装到跑通第一个程序：IDEA 2021.3.2 新手指南（含项目结构解析与.class文件位置查找）第一次打开IDEA时，面对满屏的英文菜单和陌生的项目结构，很多初学者会陷入"下一步点击哪里"的焦虑。本文将从工程化思维…

李华