news 2026/4/16 12:35:13

X-AnyLabeling:AI 驱动自动标注工具介绍

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
X-AnyLabeling:AI 驱动自动标注工具介绍

文章目录

      • 🔍 核心特点
      • 🧠 支持的任务与模型(部分)
      • 🚀 安装与使用
        • 安装方式(推荐)
        • 启动远程服务(可选)
      • 🖥️ 功能界面亮点
      • 📜 许可与使用限制
      • 🙌 社区与贡献
      • 📚 引用方式(如用于研究)

X-AnyLabeling是由 CVHub 开发的一款功能强大、支持多模态的AI 驱动自动标注工具,专为数据工程师和研究人员在工业级复杂任务中提供高效、精准的标注解决方案。

https://github.com/CVHub520/X-AnyLabeling
Computer Vision Annotation Tool (CVAT)


🔍 核心特点

  • AI 引擎集成:内置多种先进模型,支持图像分类、目标检测、实例分割、姿态估计、OCR、深度估计、图像抠图、视觉问答(VQA)、图文理解等多种任务。
  • 远程推理服务:配套提供X-AnyLabeling-Server,支持 GPU 加速、远程调用自定义模型,适用于前后端分离或团队协作场景。
  • 多格式兼容:支持主流标注格式的导入/导出,如 COCO、VOC、YOLO、DOTA、MOT、MASK、PPOCR、MMGD、VLM-R1 等。
  • 多样化标注类型:包括矩形框、旋转框、多边形、点、线、圆形等,也支持文本检测/识别、关键信息抽取(KIE)等 OCR 相关任务。
  • 一键批量推理:可对当前任务目录下所有图像执行 AI 自动标注,大幅提升效率。
  • 支持视频标注:不仅限于图像,还支持对视频帧进行自动标注与追踪。
  • 可扩展性强:允许用户集成自定义模型,进行二次开发。

🧠 支持的任务与模型(部分)

任务类型代表模型
图像分类YOLOv5/8/11-Cls, InternImage, PULC
目标检测YOLOv5–v12, YOLOX, YOLO-NAS, RT-DETR, D-FINE 等
实例分割YOLO-Seg 系列, RF-DETR-Seg, Hyper-YOLO-Seg
姿态估计YOLOv8/11-Pose, DWPose, RTMO
跟踪(MOT)Bot-SORT, ByteTrack
旋转检测YOLOv5/8/11-Obb
深度估计Depth Anything(支持深度校准)
通用分割SAM 1/2/3, SAM-HQ, MobileSAM, EdgeSAM 等
OCRPP-OCRv4/v5
视觉语言Qwen3-VL, Florence2, Gemini, ChatGPT
开放词汇检测YOLO-World, Grounding DINO, YOLOE, CountGD
图像抠图RMBG 1.4/2.0

🚀 安装与使用

安装方式(推荐)
# 通过 pip 安装(需 Python ≥ 3.8)pipinstallx-anylabeling

或从源码构建(获取最新功能):

gitclone https://github.com/CVHub520/X-AnyLabeling.gitcdX-AnyLabeling pipinstall-r requirements.txt python main.py
启动远程服务(可选)

配套的X-AnyLabeling-Server支持 RESTful API,便于集成到现有标注平台或自动化流水线中。


🖥️ 功能界面亮点

  • 多模态提示标注:支持文本提示(Text Prompt)或视觉提示(Visual Prompt)驱动的分割与检测(如 SAM + Grounding DINO 联合使用)。
  • VQA(视觉问答):可对图像提问并自动生成答案。
  • 多类别分类器:支持细粒度图像分类。
  • 一键推理当前文件夹所有图像
  • 实时预览与交互式修正:AI 建议 + 人工校正,形成高效闭环。

📜 许可与使用限制

  • 许可证:GPL-3.0
  • 免费使用范围
    • 个人非商业用途 ✅
    • 学术/教育/科研用途 ✅(需注册)
  • 商业用途:❌ 需联系cv_hub@163.com获取商业授权。

🙌 社区与贡献

  • 欢迎提交 Issue、PR,参与模型集成、文档改进或功能扩展。
  • 项目致谢了 AnyLabeling、LabelMe、CVAT 等开源标注工具。

📚 引用方式(如用于研究)

@misc{X-AnyLabeling, year = {2023}, author = {Wei Wang}, publisher = {Github}, organization = {CVHub}, journal = {Github repository}, title = {Advanced Auto Labeling Solution with Added Features}, howpublished = {\url{https://github.com/CVHub520/X-AnyLabeling}} }
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/8 10:19:50

终极指南:5步快速掌握Llama 2 ONNX部署技巧

终极指南:5步快速掌握Llama 2 ONNX部署技巧 【免费下载链接】Llama-2-Onnx 项目地址: https://gitcode.com/gh_mirrors/ll/Llama-2-Onnx 想要在本地环境中快速部署强大的AI模型推理能力吗?Llama 2 ONNX作为开源AI领域的重要项目,让每…

作者头像 李华
网站建设 2026/4/14 12:58:13

从零开始部署Wan2.2-T2V-A14B开源镜像完整教程

Wan2.2-T2V-A14B 部署实战:从零跑通高保真文本生成视频全流程 🚀 你有没有想过,输入一句“穿汉服的女孩在樱花树下起舞”,下一秒就能看到一段720P高清视频缓缓展开?🌸🎥 不是梦,也不…

作者头像 李华
网站建设 2026/4/13 2:12:52

GPTstudio:重塑R语言开发体验的智能编程伴侣

GPTstudio:重塑R语言开发体验的智能编程伴侣 【免费下载链接】gptstudio GPT RStudio addins that enable GPT assisted coding, writing & analysis 项目地址: https://gitcode.com/gh_mirrors/gp/gptstudio 在数据科学与统计分析领域,R语言…

作者头像 李华
网站建设 2026/4/11 20:26:50

系统设计能力构建:从技术困境到架构思维的完整路径

系统设计能力构建:从技术困境到架构思维的完整路径 【免费下载链接】system-design Learn how to design systems at scale and prepare for system design interviews 项目地址: https://gitcode.com/GitHub_Trending/sy/system-design 你是否曾面临这样的技…

作者头像 李华
网站建设 2026/4/15 2:37:30

毕设分享 LSTM股价预测

0 简介 今天学长向大家介绍一个机器视觉的毕设项目 毕业设计项目分享 LSTM股价预测 项目运行效果: 毕业设计 lstm股价预测🧿 项目分享:见文末! 1 LSTM 神经网络 长短期记忆 (LSTM) 神经网络属于循环神经网络 (RNN) 的一种,特别适合处理和…

作者头像 李华
网站建设 2026/4/16 9:06:48

桌面共享终极指南:如何实现RTSP/RTMP实时推流

桌面共享终极指南:如何实现RTSP/RTMP实时推流 【免费下载链接】DesktopSharing 桌面共享, 支持RTSP转发, RTSP推流, RTMP推流。 项目地址: https://gitcode.com/gh_mirrors/de/DesktopSharing 想要实现高效的桌面共享和屏幕协作吗?DesktopSharing…

作者头像 李华