news 2026/6/16 23:36:16

YOLO26改进12:SPPF-LSKA:注意力机制改进SPPF,增强多尺度特征提取能力

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
YOLO26改进12:SPPF-LSKA:注意力机制改进SPPF,增强多尺度特征提取能力

论文介绍

摘要

视觉注意力网络(VAN)中的大核注意力(LKA)模块已被证明在一系列视觉任务中表现出卓越性能,甚至超越视觉变换器(ViTs)。然而,LKA模块中的深度卷积层在卷积核尺寸增大时,计算量和内存占用呈二次方增长。为缓解这一问题,并支持在VAN的注意力模块中使用极大卷积核,本文提出了一种大分离核注意力模块(LSKA)。LSKA将深度卷积层的二维卷积核分解为级联的水平与垂直一维核。相比标准LKA设计,该分解方法可直接在注意力模块中使用大核深度卷积层,无需额外模块。
实验表明,VAN中提出的LSKA模块在性能上与标准LKA模块相当,同时降低了计算复杂度和内存占用。研究还发现,随着核尺寸增大,LSKA设计使VAN更倾向于关注物体形状而非纹理。此外,本文首次在ImageNet的五种损坏版本数据集上系统评估了VAN中的LKA与LSKA、ViTs及近期ConvNeXt的鲁棒性。
大量实验结果表明,随着核尺寸增大,VAN中的LSKA模块显著降低了计算复杂度和内存占用,同时在物体识别、检测、语义分割及鲁棒性测试中优于ViTs和ConvNeXt,并与VAN中的LKA模块性能相当。

文章地址:论文地址

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 20:54:37

springboot基于微信小程序的旅游线路定制系统_u13nyaer_sf062

一、项目技术介绍 开发语言:Java 框架:springboot JDK版本:JDK1.8 服务器:tomcat7 数据库:mysql 5.7(一定要5.7版本) 数据库工具:Navicat11 开发软件:eclipse/myeclipse/…

作者头像 李华
网站建设 2026/6/13 1:55:30

ArcGISPro水文水资源、水生态与水环境领域应用;流域划分、空间分析、遥感提取、三维淹没模拟、克里格插值、统计建模等

随着全球水资源管理与环境保护需求的日益增长,地理信息系统(GIS)技术已成为水文、水资源、水生态及水环境领域不可或缺的分析工具。ArcGIS Pro作为ESRI推出的新一代桌面GIS平台,集成了强大的数据采集、处理、分析与可视化功能&…

作者头像 李华
网站建设 2026/6/15 16:46:48

推荐系统中的Embedding技术:从Word2Vec到BERT

推荐系统中的Embedding技术:从Word2Vec到BERT 关键词:Embedding、推荐系统、Word2Vec、图神经网络(GNN)、BERT、向量空间、语义表征 摘要:在推荐系统中,“如何让计算机真正理解用户和物品的’内在联系’“是核心难题。Embedding技术通过将用户、商品、文本等离散对象转化…

作者头像 李华