news 2026/6/9 22:47:19

目标检测——锚框

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
目标检测——锚框

基于锚框的目标检测:
在图像中随机生成很多个锚框,首先预测锚框内是否含有目标

然后预测锚框与目标真实的边缘框的偏移

生成锚框后,通过IoU(交并比)来计算两个框之间的相似度,0表示无重叠,1表示重合

IoU=Area(A∩B)/Area(A∪B)​

简单说:IoU 是 “两个框重叠部分的面积” 占 “两个框整体覆盖面积” 的比例

赋予锚框标号:

每个锚框是一个训练样本,将每个锚框,要么标注成背景,要么关联上一个真实边缘框(IoU最大的那个)

非极大值抑制(NMS)输出:其作用是解决 “同一目标被多个锚框重复预测” 的问题

  1. 前置基础:目标检测中每个 “锚框”(预设的候选框)会预测一个边界框,但同一目标会被多个锚框覆盖,产生大量重叠框;
  2. 选最优框:在所有非背景类的预测框中,选择置信度最高的框作为 “基准框”;
  3. 剔除重叠框:计算其他框与基准框的IoU(交并比),去掉 IoU 大于阈值θ(通常取 0.5~0.7)的框(这些框是对同一目标的重复预测);
  4. 循环筛选:对剩余框重复 “选最高置信度框→剔除重叠框” 的步骤,直到所有框要么被选中,要么被剔除。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 12:29:25

互联网大厂Java面试:音视频场景下的技术栈深度解析

互联网大厂Java面试:音视频场景下的技术栈深度解析 场景设定 在一场互联网大厂的Java开发岗位面试中,面试官和水货程序员谢飞机展开了一场关于音视频场景的技术讨论。谢飞机虽有点小聪明,但面对复杂问题时常含糊其辞。 第一轮提问 1. 请简…

作者头像 李华
网站建设 2026/6/10 14:33:25

臭双非的技术学习之旅——Meta Quest3开发篇

嗨嗨嗨 知识点捏 这个部分其实很杂哼乱,没有一个系统的教学。我们以目前可公开的信息来统合我们的知识点 目前可公开的信息 Quest3 开发使用的是Mate已经研究出的一份较为完善的架构,可以在unity的资源商店里面找到all in one SDK ,它提供了很…

作者头像 李华
网站建设 2026/6/10 12:25:32

YOLOv11改进 - C3k2融合 | C3k2融合Mona多认知视觉适配器(CVPR 2025):打破全参数微调的性能枷锁:即插即用的提点神器

前言 本文介绍了新型视觉适配器微调方法Mona,并将其集成到YOLOv11中。传统全参数微调成本高、存储负担重且有过拟合风险,现有PEFT方法性能落后。Mona仅调整5%以内的骨干网络参数,在多个视觉任务中超越全参数微调。其核心亮点包括参数效率高、性能突破和即插即用。适配器模块…

作者头像 李华
网站建设 2026/6/10 12:30:55

simulink中使用fft进行频谱分析卡死可能的解决方法

simulink中使用fft进行频谱分析卡死可能的解决方法 分析前需要确保的设置 在配置参数里面取消勾选单一仿真输出; 在Scope中打开将数据记录到工作区 检查数据维度, FFT工具箱仅仅能分析一维数据, 例如下图中左边为一维数据, 右边的为二维数据, 将右边的数据导入到MATLAB工作区进…

作者头像 李华
网站建设 2026/6/10 12:31:54

Dolby Atmos Lite:轻量级全景声音效模拟工具,多设备音效增强方案

Dolby Atmos Lite是一款专注于音效增强的轻量级工具,旨在通过算法模拟杜比全景声的沉浸式音频体验。该软件以其极小的体积和广泛的设备兼容性,为用户提供了简单的音效优化解决方案,特别适合希望在普通设备上获得更好音频体验的用户。 获取地…

作者头像 李华
网站建设 2026/6/10 12:26:18

python第一阶段第10章

1. 整体介绍1.1 数据来源2. 效果一: 折线图-----2020印美日新冠累计确诊人数2.1 json数据格式2.1.1 什么时json2.1.2 json有什么用2.1.3 json格式数据转化import json # 准备列表 ,列表内每一个元素都是字典,将其转换为json data [{"na…

作者头像 李华