news 2026/6/10 23:05:06

多模态目标检测-LLVIP数据集处理(清洗+YOLO格式)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
多模态目标检测-LLVIP数据集处理(清洗+YOLO格式)

0、介绍

2021 年,北京邮电大学的研究团队发布了LLVIP 数据集,首次为低光照下的可见光-红外多模态任务提供了大规模、高精度的统一基准。


基本信息:

  • 总样本量:15488对严格对齐的图像(共30976张)
  • 分辨率:可见光 1920×1080,红外 1280×720(统一裁剪为 1080×720)
  • 场景:26 个不同城市街道场景,全部拍摄于傍晚 6 点至 10 点的极暗环境
  • 标注:所有图像均包含行人边界框标注(person)
  • 官方划分:训练集(12025 对)+ 测试集(3463对);测试集需自己从训练集中划分!
  • 数据集下载地址:https://bupt-ai-cz.github.io/LLVIP/
  • 论文链接:LLVIP: A Visible-infrared Paired Dataset for Low-light Vision | IEEE Conference Publication | IEEE Xplore

为什么需要 LLVIP?

  • TNO 数据集:仅 261 对图像,样本量太小,完全不适合深度学习
  • KAIST/FLIR 数据集:面向自动驾驶,驾驶视角且夜间图像亮度仍较高
  • OSU 数据集:全部采集于白天,红外图像完全没有优势
  • CVC-14 数据集:图像时间不对齐,无法用于图像融合任务

与主流数据集对比:

数据集样本量是否对齐场景视角低光照程度行人标注
TNO261 对军事地面中等
KAIST4750 对交通驾驶
FLIR5258 对×交通驾驶
CVC-14849 对×交通驾驶
LLVIP16836 对街道监控极暗

优势:

  • 时空严格对齐:采用双目相机同步采集,经过半手动配准,像素级对齐,完美支持图像融合和有监督图像翻译
  • 纯低光照场景:绝大多数图像拍摄于无路灯或极弱光照的环境,红外图像的互补作用极其明显
  • 高精度行人标注:首创 "红外标注反向映射" 方法,解决了低光照可见光图像标注难的问题
  • 大规模高质量:1.6 万对样本是当时同领域最大的数据集,且图像质量远高于其他数据集

图例:


为了用yolo模型对数据集进行测试,需转换格式并划分数据集

1、下载数据集

下载得到压缩文件,解压后得到以下文件夹

annotations是voc标签

infrared是红外光图像

visible是可见光图像

2、转换数据集格式(VOC2YOLO)

参考:目标检测-数据处理,YOLO2JSON、VOC2YOLO、YOLO2VOC、JSON2YOLO-CSDN博客

注意:此处有个坑,原始的train图像文件夹下的

100030.jpg
100033.jpg

这两个图像没有目标,所以可以把它们删除,不然数据集和标签数量不对等

3、划分数据集

按照train:val:test=7:1:2划分,但由于test已经划分好了,3463/15488=0.2236,只能让val的比例尽可能为0.1,差不多就是1804张,则train就是10218张

划分数据集参考:

目标检测-数据划分(YOLO格式)_yolo数据集划分代码-CSDN博客

最终划分结果为:

train10218
val1805
test3463

4、可视化验证

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 22:57:40

猫抓浏览器扩展:5步智能媒体资源嗅探与自动化下载完全指南

猫抓浏览器扩展:5步智能媒体资源嗅探与自动化下载完全指南 【免费下载链接】cat-catch 猫抓 浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 在当今数字内容丰富的时代&a…

作者头像 李华
网站建设 2026/6/10 22:52:53

小程序毕业设计-基于微信小程序的智能包裹配送服务管理系统基于springboot+微信小程序的智能包裹配送服务管理系统小程序(源码+LW+部署文档+全bao+远程调试+代码讲解等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/6/10 22:52:28

星空-星瀚对接记录

-- 星瀚暂估应收单 fl库 select * from t_ar_busbill where fbillnoARUB-000139 -- 暂估应收单分录 select * from t_ar_busbillentry where fid (select fid from t_ar_busbill where fbillnoARUB-000139) --财务应收单 select * from t_ar_finarbill wh…

作者头像 李华
网站建设 2026/6/10 22:47:50

食品虚假宣传有机被职业打假,品牌危机公关里有机认证怎么解释

在快消品行业,食品虚假宣传有机遭遇职业打假是常见且棘手的舆情场景。当品牌面临此类危机时,对有机认证的解释在危机公关中起着至关重要的作用。下面为您详细阐述如何在危机公关中解释有机认证。一、及时准确呈现有机认证信息当品牌被职业打假指控虚假宣…

作者头像 李华
网站建设 2026/6/10 22:46:46

工作流智能体_推理型智能体ReAct Agent_Agent平台---AI大模型系统从零开始0008

然后来看一下,因为很多人都在做agent,最后可能就有专门做agent平台的。比如 这个平台就是专门做法律agent,比如他有个节点叫做,红线条款查询之类的。 专门做agent来做法律这个行业的。 1. Harvey AI(法律 AI 独角兽,最火) 成立:2022 年,美国 估值:约 92 亿美元(20…

作者头像 李华
网站建设 2026/6/10 22:45:55

Gpt-Oss-120B (Free) 开源大模型深度评测报告

最近在项目里接手了一个新的对话式 AI 集成任务,团队对于选型有些纠结。市面上模型层出不穷,参数表看得人眼花缭乱,但真正落到实际业务中,到底哪个能扛得住多轮对话的上下文压力?哪个在长文档处理上不会“断片”&#…

作者头像 李华