news 2026/4/28 3:33:12

2025AAAI-DivShift: Exploring Domain-Specific Distribution Shift in Large-Scale, Volunteer-Collected

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
2025AAAI-DivShift: Exploring Domain-Specific Distribution Shift in Large-Scale, Volunteer-Collected

文章主要内容和创新点总结

一、主要内容

  1. 研究背景:iNaturalist等公民科学项目提供的大规模志愿者收集生物多样性数据集,推动了机器学习在物种细粒度视觉分类等生物多样性监测任务中的性能提升,但这类数据存在地理、时间、分类学、观察者和社会政治等多种偏差,其对物种识别模型性能的影响尚不明确。
  2. 核心框架与数据集
    • 提出DivShift框架,用于量化特定领域分布偏移对机器学习模型性能的影响,通过测量数据集不同分区的域内与域外模型性能差异,并与标签分布偏移进行对比,评估偏差的影响。
    • 构建DivShift-NAWC数据集,包含北美西海岸近750万张iNaturalist图像,涵盖7500多种植物,按五种专家验证的偏差类型划分,为偏差影响评估提供受控案例。
  3. 研究方法:使用ResNet-18、ResNet-50和ViT等模型,基于多种精度指标(如单图像精度、物种精度、稀有度加权精度等),对比不同偏差分区下的物种识别性能,分析数据量、偏差类型与模型泛化能力的关系。
  4. 关键发现
    • 所有偏差分区均为弱偏差,模型性能变化小于标签分布偏移的预期影响。
    • 数据量对模型性能有正向影响,但提升幅度因偏差类型而异;例如,来自人类活动频繁区域、非挑战期、活跃观察者的数据集训练出的模型泛化能力更强。
    • 社会政治偏差导致跨区域模型性能下降最显著,但
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/26 21:32:04

暗网Omertà市场因真实服务器IP泄露被迫关停

平台崛起与迅速陨落暗网生态始终在新平台涌现与突然关闭之间动态变化,这种波动往往源于其承诺的匿名性本身。2025年11月21日,名为Omert Market的新平台登场,自诩为稳定与安全的堡垒。运营团队标榜"安全重于炫技"的理念,…

作者头像 李华
网站建设 2026/4/25 23:46:33

STM32通过PWM实现呼吸灯效果:代码详解与硬件连接

文章目录 摘要1. 引言1.1 呼吸灯应用场景1.2 PWM技术原理 2. 硬件准备2.1 所需材料清单2.2 STM32引脚分配2.3 连接示意图 3. 开发环境搭建3.1 软件安装步骤3.2 CubeMX关键配置 4. PWM配置详解4.1 定时器参数计算 5. 代码实现5.1 文件结构5.2 核心代码:main.c5.3 PWM…

作者头像 李华
网站建设 2026/4/23 16:22:30

vue基于springboot的生鲜海鲜商城交易系统设计与实现没论文

目录已开发项目效果实现截图开发技术介绍系统开发工具:核心代码参考示例1.建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】2.计算目标用户与其他用户的相似度系统测试总结源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式&…

作者头像 李华
网站建设 2026/4/19 0:34:34

给数组装上超能力:JavaScript数组方法趣味指南

欢迎使用我的小程序👇👇👇👇 俱好用助手功能介绍 你是否曾感觉JavaScript数组像个装满数据的“沉默集装箱”?今天,我们来给它装上超能力!🚀 为什么数组方法如此重要? …

作者头像 李华
网站建设 2026/4/27 7:22:40

智慧水务|供排水解决方案

水,是生命之源,更是城市发展的核心命脉。随着城市化进程的不断加快,传统的供水排水方式已经无法满足日益增长的需求。如何保障供排水安全,提高运营效率,实现节能降耗,成为水务行业亟待解决的问题。深圳市恒…

作者头像 李华