news 2026/4/16 7:59:18

频域+Transformer!顶会优先推荐思路,发文效果显著!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
频域+Transformer!顶会优先推荐思路,发文效果显著!

频域+Transformer这个方向的核心吸引力在于,它给Transformer的黑箱机制提供了个全新的、可解释的理论视角,并带来了实质性的性能与效率提升。

因此它在当前是非常热门且适合发表高水平论文的方向,从顶会到顶刊都有不少成果。比如TMM 2025的Frefusion框架、IEEE TGRS的FGNet模型、ECCV 2024的FADformer框架...

从这些研究中可以看出,这方向接下来的创新将更侧重于理论深度、架构通用性、领域延展性以及软硬协同。如果想入手,建议基于现有成果找突破口。本文整理了11篇频域+Transformer前沿论文,附代码,需要参考的直接领取即可。

全部论文+开源代码需要的同学看文末

FreDFT: Frequency Domain Fusion Transformer for Visible-Infrared Object Detection

方法:论文提出频域融合 Transformer(FreDFT)用于可见光 - 红外目标检测,通过频域注意力和频域前馈层挖掘跨模态互补信息,结合局部特征增强与跨模态全局建模,解决模态不平衡问题,提升检测性能。

创新点:

  • 将频域与Transformer结合,提出FreDFT用于可见光-红外目标检测,挖掘跨模态互补信息。

  • 设计MFDA和FDFFL,分别捕捉模态相关性、融合多尺度频域特征。

  • 构建LFEM和CGMM,强化局部特征并缓解模态异质性,解决模态不平衡。

Frefusion: Frequency Domain Transformer for Infrared and Visible Image Fusion

方法:论文提出Frefusion框架用于红外与可见光图像融合,通过频域特征提取模块提取源图像频域特征,借助含域内/域间强化模型的频域Transformer融合模块融合特征,结合残差重建模块生成融合图像,利用频域特性提升融合质量与抗伪影能力。

创新点:

  • 提出频域特征提取模块,通过FFT和iFFT转换特征,提取图像深层语义与全局纹理信息。

  • 设计含域内/域间强化的频域Transformer融合模块,增强模态内有效信息与模态间互补信息。

  • 构建残差重建模块与多损失函数,联合优化红外与可见光图像融合质量。

Efficient Frequency-Domain Image Deraining with Contrastive Regularization

方法:论文提出 FADformer 用于单图像去雨,通过融合傅里叶卷积混合器在频域与空域高效建模全局 - 局部特征,结合先验门控前馈网络强化细节修复,并引入频域对比正则化利用正负样本信息,实现高效且高质量的去雨效果。

创新点:

  • 设计融合傅里叶卷积混合器,在频域与空域同步进行卷积操作,高效捕捉全局-局部特征,降低计算成本。

  • 提出先验门控前馈网络,以门控方式引入残差通道先验,强化局部细节修复与特征结构保留。

  • 引入频域对比正则化,利用DFT构建对比空间,充分挖掘正负样本的频域特征差异,提升去雨性能。

Frequency-domain guided swin transformer and global-local feature integration for remote sensing images semantic segmentation

方法:论文提出 FGNet 用于遥感影像语义分割,将频域引导机制融入 Swin Transformer 构建 FGSwin,结合残差 CNN 提取局部特征与全局 - 局部特征融合模块(GLFI),同步建模频域、空域及全局 - 局部特征,提升分割精度与类别区分度。

创新点:

  • 提出FGSwin,将频域引导机制融入Swin Transformer,结合FFT和可学习权重建模频域与空域信息。

  • 设计GLFI模块,通过小卷积核和SiLU激活函数,轻量化融合全局与局部特征。

  • 构建双分支架构,结合FGSwin与残差CNNs,提升遥感影像语义分割的精度与类别区分度。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“222”获取全部方案+开源代码

码字不易,欢迎大家点赞评论收藏

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 14:28:50

程序员最优秀的简历如何写,才能拿高薪offer?并且丝滑通过面试?

程序员最优秀的简历如何写,才能拿高薪offer?并且丝滑通过面试? 好的,程序员要写出能拿到高薪offer、面试过程顺畅的简历,关键在于精准匹配、突出价值、清晰表达。以下是具体的建议: 1. 精准定位与岗位匹配…

作者头像 李华
网站建设 2026/4/16 12:42:13

Linux命令-lilo(安装核心载入开机管理程序)

&#x1f9ed;说明 lilo 是 Linux 系统中一个历史悠久的引导加载程序&#xff0c;负责在系统启动时加载操作系统内核。虽然现在很多发行版已改用 GRUB&#xff0c;但了解 lilo 对维护旧系统或理解启动原理仍有价值。 下面这个表格汇总了 lilo 命令的核心选项。选项说明-C <c…

作者头像 李华
网站建设 2026/4/15 16:26:21

从初级到资深:提示工程架构师的5阶晋升路径+每个阶段的核心能力

从Prompt新手到AI解决方案设计师&#xff1a;提示工程架构师的5阶成长地图 关键词 提示工程、大模型应用、系统设计、业务赋能、能力跃迁、AI生态、Prompt方法论 摘要 当ChatGPT把“提示工程”从技术圈推向大众视野时&#xff0c;很多人误以为它是“写Prompt的技巧”——但…

作者头像 李华
网站建设 2026/4/16 9:03:49

IP协议及以太网协议

文章目录 IP协议IP协议在网络体系中的位置IP协议的核心功能IP网络的透明性IP 数据报首部格式IP数据报分片IP 数据报首部中与分片有关的字段中的数值 以太网协议以太网协议在网络体系中的位置数据链路层的地位数据链路层信道类型以太网 V2 的 MAC 帧格式无效的MAC帧 IP协议 IP协…

作者头像 李华
网站建设 2026/4/16 9:03:05

为什么数字产品护照需要DPM条形码—以及如何实现精准扫描

为什么数字产品护照需要DPM条形码——以及如何实现精准扫描 一场重大变革正在发生&#xff1a;产品开始拥有持久的、可扫描的数字身份&#xff0c;用于追踪其从制造到报废的整个生命周期&#xff0c;包括产品历史、材料和使用情况。虽然这一概念尚未在全球范围内完全标准化&…

作者头像 李华