news 2026/4/16 19:55:57

Manus数据手套:从人类手部运动到机器人灵巧手实时映射

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Manus数据手套:从人类手部运动到机器人灵巧手实时映射

机器人灵巧手正在成为具体化人工智能的基石。运动捕捉、模拟、强化学习和自我监督基础模型的最新进展使机器人能够执行越来越像人类的操纵技能。

人手由27块骨头、几十块肌肉和肌腱以及近30个自由度组成。复制人手的精确性、适应性和触觉控制仍然是机器人领域最大的挑战之一。

建造一只与人手灵活性、灵敏性和协调性相匹配的机器人手不仅需要机械设计,还需要能够将人类运动转化为智能控制的先进训练管道。

本文比较了两个领先的培训策略,RialTo和V-JEPA 2,并概述了MANUS手套如何支持这两种方法实现遥操作机器人灵巧手。

通过模拟协调现实:一种用于遥操作的真实对比模拟仿真的方法(麻省理工学院计算机科学与人工智能实验室)

V-JEPA 2:自我监督视频模型实现理解、预测和规划(Meta AI)

两种培训策略:RialTo vs. V-JEPA 2

RialTo:从真实-模拟-真实的培训方案

RialTo将模仿学习(IL)和强化学习(RL)结合起来,为特定的操纵任务训练提供数据高效的控制策略。

该过程从真实世界的演示开始,在模拟中扩展学习,并将改进的策略用于物理部署。

它是如何工作的

捕捉专家演示:演示可以通过人类操作员通过远程操作或运动捕捉执行任务来获得,这为初始学习提供了高质量的演示数据。

建立一个数字孪生:具有精确三维物理和视觉感官真实的环境数字孪生,以创造一个适用于模拟的训练空间。

模拟训练:机器人执行强化学习试验,对物体位置、照明和物理干扰进行领域随机化,以建立稳定性。

虚拟现实部署:优化的基于视觉的策略部署在机器人上,在现实条件下保持稳定性和精确性。

这种真实到模拟到真实的循环允许机器人大规模安全训练,弥合模拟与现实之间的差距,并在动态环境中实现可靠的表现。

虚拟JEPA新策略——自我监督的世界模型

V-JEPA 2使用自我监督学习(SSL)来建立一个连接感知和物理行为的通用世界模型。

它不是掌握一项任务,而是学习运动和因果关系的广泛表示,从而能够在不熟悉的环境中进行零样本学习。

它是如何工作的

无动作预训练(V-JEPA 2):大型视觉转换器(ViT)通过预测不同在线视频中的掩蔽区域来学习对运动、外观和物理动态的总体理解。

动作条件后训练(V-JEPA-AC):一个较小的改变在来自大型机器人操作数据集中未标记机器人视频微调,以促使其能够学习已执行动作和环境变化之间的核心关系。

规划和控制:该系统使用模型预测控制(MPC)来预测未来状态,并选择使其最接近目标的行动,不需要特定任务的奖励或再培训。

这种自我监督的过程使机器人能够跨任务进行归纳,适应新环境,并在没有特定任务经验的情况下智能地行动。

通过MANUS手套捕捉人体运动

RialTo和V-JEPA 2都依靠高保真的人类和机器人运动数据来连接感知和行动。

这些数据通常通过使用高级手部跟踪解决方案的遥控操作来收集,MANUS手套可以高精度、低延迟地捕捉手指的细微动作。

通过实时记录自然的手部运动,MANUS为创建灵巧手遥操作和训练的数据集提供了基础,从而推动了应用化人工智能研究。

运动数据表示

关节角度数据

最常见的格式是将人类手指关节旋转直接映射到机器人手关节。这种方法快速简单,但是当人和机器人的运动学不同步时将会失去准确性。

指尖轨迹映射

一种新兴的方法将关注指尖位置和方向,而非关节旋转。这减少了运动不匹配,并提高了精细任务的精度,如手动操作和工具使用。

模拟策略培训

在RialTo风格的管道中,远程操作的运动数据可以传输到模拟训练中,在模拟中,强化学习和域随机化可以帮助机器人适应照明、纹理和物理动态的变化。

NVIDIA Isaac Sim等模拟平台可为机器人训练提供了安全、可扩展的环境。

有了机器人训练框架,Isaac实验室2.3,研究人员可以加速全身控制,集成多个遥操作接口(包括MANUS手套、Apple Vision Pro和Vive手部跟踪),更高效地评估策略性能。

结论

RialTo和V-JEPA 2的核心是通过捕捉到的高保真人体运动数据来训练机器人。

在RialTo中,这些数据为数字孪生模拟中的模仿学习提供了基础事实。

在V-JEPA 2中,其提供了因果基础,帮助AI理解人类运动如何影响现实世界的结果。

凭借毫米级的精确度和真实程度,MANUS手套证明了精确的动作捕捉将有巨大的潜力把人类的灵活性和机器的智能连接在一起。

随着人工智能的不断发展,人类运动和机器人学习之间的协同作用将塑造下一代更灵巧、适应性更强的机器人,实现与世界自然互动。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 10:39:26

告别复杂操作!易知微行业 Demo 合集亮相,可视化超简单

在科技革新的浪潮下,数字孪生已跻身新时代焦点议题。作为物理实体的数字化镜像,它不仅深度融合物联网、大数据、人工智能等前沿技术,更引领各行业驶入智能化、精细化发展的全新赛道。数字孪生的蓬勃兴起,既为工业制造、城市治理等…

作者头像 李华
网站建设 2026/4/16 9:15:18

python

sdfds

作者头像 李华
网站建设 2026/4/16 15:37:24

2025 GEO自建vs外包决策分析:投入产出完整测算

自建GEO团队成本测算:180万(6人团队) | 外包GEO服务成本:100万 | Build vs Buy,如何选择? 某B轮公司CEO在董事会上被问到一个经典问题:"我们已经外包GEO服务1年,花了100万,为什么不自建团队?6个人年薪180万,虽然贵20%,但团队是我们自己的,知识可沉淀,长期看更划算吧?&…

作者头像 李华
网站建设 2026/4/16 14:27:32

全面掌握AI大模型:从零基础入门到实战应用的七阶段学习路线图全攻略!

文章提供了完整的大模型学习路线图,分为七个阶段:系统设计、提示词工程、平台应用开发、知识库应用开发、微调开发、多模态大模型应用和行业应用构建。路线涵盖Transformer架构、训练方法、Python编程、工具使用、API开发、RAG技术、向量数据库等核心技术…

作者头像 李华
网站建设 2026/4/16 17:05:15

基于单片机控制的无线烟雾检测报警系统

摘 要 家庭火灾是一种常见的安全隐患,其危险性随着现代生活方式和家庭用电设备的增加而不断增加。为了提高火灾的及时性识别和处理,采取措施来预防火灾的发生变得尤为重要。在这些预防措施中,安装火灾报警器是一项简单且有效的措施&#xff…

作者头像 李华
网站建设 2026/4/16 11:01:35

AI 原生应用开发框架深度解析:从单智能体到多智能体协同开发

当 ChatGPT 带火 “生成式 AI” 后,我们很快发现:单纯的内容生成早已满足不了复杂业务需求 —— 我们需要 AI 能自主拆解任务、调用工具、协同工作,这就是 “智能体(Agent)” 的价值。而要落地智能体,离不开…

作者头像 李华