AI编码助手技能包：MJLab机器人仿真开发与Isaac Lab迁移实战指南-编程阁

1. 项目概述：一个为AI编码助手量身定制的技能工具箱

如果你正在使用像Cursor、Claude Code、Codex这类AI编码助手进行机器人仿真或强化学习开发，特别是涉及从NVIDIA的Isaac Lab迁移到MJLab（MuJoCo Lab）框架，或者从零开始构建MJLab原生任务，那么你很可能遇到过这样的困境：AI助手给出的代码片段要么是通用的、缺乏针对性的，要么就是基于过时的API或错误的模式，导致你不得不花费大量时间手动修正和调试。这正是mjlab-skillkit这个项目要解决的核心痛点。

简单来说，mjlab-skillkit是一个“技能包”或“知识库”，它不是一个独立的软件库，而是一套精心编排的规则、参考文档和工作流指南。它的目标是将领域专家（熟悉Isaac Lab和MJLab的开发者）的知识和经验，系统地“注入”到AI编码助手中。当你在IDE里向AI助手提出诸如“如何将Isaac Lab的XXX任务迁移到MJLab？”或“如何在MJLab中创建一个新的机械臂抓取任务？”这类问题时，安装了此技能包的AI助手就能调用这些预设的、高质量的上下文信息，给出更精准、更符合MJLab最佳实践的代码和建议，从而极大提升开发效率。

这个工具包的定位非常清晰：它不是替代开发者，而是增强AI助手，使其成为你在特定领域（MJLab开发与迁移）的专家级协作者。它围绕两大核心能力构建：Isaac Lab迁移技能和MJLab原生编写技能。前者确保迁移过程行为一致、代码干净；后者则指导你从零开始，写出地道的MJLab代码。

2. 核心设计思路与方案选型解析

2.1 为什么选择“技能包”而非“代码生成器”？

在项目启动之初，我们面临几个关键选择。一种思路是开发一个全自动的代码转换工具，输入Isaac Lab项目，直接输出MJLab项目。这种方案听起来很美好，但实际上面临巨大挑战。Isaac Lab和MJLab虽然都是机器人仿真框架，但它们在架构哲学、API设计、场景描述方式上存在根本性差异。Isaac Lab基于USD场景图和PhysX，而MJLab基于MuJoCo的MJCF和自有的一套Python API。强行进行一对一的语法转换，只会产生一堆难以维护、充满“胶水代码”的残次品，无法利用MJLab的新特性和性能优势。

因此，我们选择了“技能包”这条更务实、也更有效的路径。它的核心思想是“授人以渔”。我们不去尝试自动化整个复杂的、充满设计决策的迁移过程，而是将这个过程拆解成一系列可遵循的规则、映射关系和最佳实践，然后让AI助手在开发者的实时指导下，逐步完成迁移或创作。这样做有几个显著优势：

灵活性高：开发者始终掌握控制权，可以根据具体任务的特殊性调整迁移策略。
输出质量高：生成的代码是“MJLab原生”的，符合其设计模式和社区惯例，易于后续维护和扩展。
教育意义强：开发者在与AI协作的过程中，能潜移默化地学习到MJLab的核心概念和设计模式，而不仅仅是得到一个黑箱的输出。
适配性强：技能包以纯文本（Markdown/YAML）形式存在，可以轻松适配各种不同的AI助手平台（Codex, Claude, Cursor等），无需为每个平台重写核心逻辑。

2.2 双技能架构：迁移与创作的分而治之

项目将能力明确划分为“迁移”和“原生创作”两大技能，这是经过深思熟虑的。这两个场景虽然都产出MJLab代码，但开发者的心智模型、所需的知识和面临的挑战截然不同。

Isaac Lab迁移技能：面对的是一个已有的、可运行的Isaac Lab项目。开发者的核心诉求是“功能对等”和“行为保真”。因此，该技能的重点在于概念映射和模式转换。它需要告诉AI助手：“在Isaac Lab里用Articulation对象控制机器人，在MJLab里对应的核心概念是MjArticulation，但初始化方式、属性访问接口分别是这样的...”。同时，还需要处理那些没有直接对应关系的“坑”，比如两个仿真器在碰撞检测、传感器噪声模拟上的细微差别。
MJLab原生技能：面对的是一张白纸。开发者的诉求是“快速启动”和“符合规范”。因此，该技能的重点在于提供脚手架和引用范例。它需要引导AI助手：“创建一个新的MJLab任务，通常需要继承MjEnv类，并在__init__中配置MjScene；添加一个末端执行器位置传感器，可以参考mjlab/tasks/目录下的reach.py示例；配置PPO训练参数时，这些超参数是常用的起点...”。

通过这种分而治之的策略，技能包能为AI助手提供高度聚焦的上下文，避免信息混杂，从而生成更高质量的提示。

2.3 多AI助手适配层设计

另一个关键设计点是支持多种AI编码助手。我们观察到，不同团队、不同开发者有自己偏好的工具链。有人喜欢深度集成在VSCode里的Cursor，有人习惯使用Claude Code或独立的Gemini CLI，还有团队在使用基于OpenAI Codex的自研平台。

为了最大化工具包的效用，我们没有将规则硬编码到某一种助手的特定格式里，而是设计了一个“核心规则库+适配器”的架构。

核心规则库 (shared/mjlab-skillkit-rules.md)：这里存放着与具体AI助手无关的、纯粹的领域知识、规则和指南。这是技能包的“真理之源”。
适配器 (Adapters)：针对每个目标AI助手（Cursor, Claude Code, Codex等），我们提供一个薄薄的适配层。这个适配层主要做两件事：
- 格式转换：将核心规则库的内容，转换成目标助手能识别和高效利用的格式。例如，对于Cursor，是.mdc文件；对于Claude Code，是特定的Markdown规则文件；对于Codex，可能是YAML格式的智能体（Agent）配置。
- 路径映射：提供安装脚本，将格式化后的技能包文件放置到AI助手约定的目录下（如~/.cursor/rules/或~/.claude/rules/）。

这种设计保证了核心知识的单一维护点，同时又能灵活地扩展到新的AI助手平台。

3. 核心组件与内容深度解析

3.1 Isaac Lab迁移技能详解：从概念映射到行为保真

迁移技能是整个工具包中最具挑战性的部分。它不是一个简单的“查找替换”表，而是一个包含了多层次知识的决策树。

3.1.1 核心概念映射表 (references/mapping.md)这是迁移的基石。它系统性地列出了Isaac Lab和MJLab中对应（或近似对应）的核心抽象。理解这些映射关系，是正确翻译代码逻辑的前提。例如：

场景 (Scene)：Isaac Lab的World和USD舞台，对应MJLab的MjScene和MJCF模型文件。这里的关键差异在于，Isaac Lab的场景是动态构建的，而MJLab严重依赖静态的MJCF XML文件进行物理和视觉描述。
智能体/关节体 (Articulation)：Isaac Lab的ArticulationView提供了对机器人状态的批量操作，而MJLab的MjArticulation更接近底层数据。迁移时，需要将基于视图的操作，转换为对MjArticulation属性（如qpos,qvel,qfrc_actuator）的直接读写。
传感器 (Sensors)：两者都有位置、速度、力传感器等。但Isaac Lab的传感器通常作为Sensor对象附加到实体上，而MJLab的传感器在MJCF中定义，并通过MjData中的特定字段（如sensordata）访问。迁移时需要重写传感器的数据流获取逻辑。
奖励与终止条件 (Rewards & Terminations)：Isaac Lab使用RewardFunction和TerminationCondition类，而MJLab通常在任务类的step或compute_terminated/compute_truncated方法中直接计算。这需要将面向对象的回调模式，转换为过程式的计算函数。

3.1.2 迁移模式与陷阱 (references/patterns.md,references/migration-gotchas.md)仅有映射表是不够的。我们总结了数十个常见的迁移“模式”和“陷阱”。

模式示例：“如何迁移一个基于目标位置的奖励函数？” 模式会指导：1) 在MJLab中如何获取末端执行器当前位置（通过正运动学或传感器）；2) 如何计算与目标位置的误差；3) 如何将误差转换为标量奖励（如使用指数衰减或L2距离的负数）。
陷阱示例：“仿真步长（dt）不一致导致行为异常”。Isaac Lab和MJLab默认的仿真步长可能不同，直接迁移代码而不调整与控制频率相关的参数（如PID控制器的增益、速度计算的差分间隔），会导致机器人行为变得不稳定或完全错误。技能包会明确指出这个陷阱，并提醒在迁移后必须验证和调整dt相关参数。

3.1.3 复杂任务迁移手册 (references/complex-task-migration-playbook.md)对于像“四足机器人行走”、“机械臂灵巧操作”这类复杂任务，我们提供了按步骤拆解的迁移手册。它不再是零散的规则，而是一个完整的剧本：

阶段一：场景与资产迁移。指导如何将USD模型转换为MJCF，如何处理材质和纹理，如何设置光照和相机。
阶段二：机器人与控制迁移。指导如何重建关节驱动模型，如何将Isaac Lab的控制器（如PID、逆动力学）用MJLab的方式重写。
阶段三：任务逻辑迁移。逐步将奖励函数、观察空间、动作空间、重置逻辑进行转换。
阶段四：集成与调试。提供如何将前三阶段的输出组装成一个可运行的MjEnv，并给出常见的集成后调试检查点。

3.2 MJLab原生创作技能详解：从零到一的指南

对于新建任务，技能包扮演着“引路人”和“代码模板”的双重角色。

3.2.1 创作工作流 (references/mjlab-authoring-workflow.md)这份文档定义了一个标准的MJLab任务开发流程，确保新手也能按图索骥，产出结构清晰的代码。典型流程包括：

定义任务配置 (EnvCfg)：首先在配置数据类中声明所有可调参数，如机器人模型路径、目标范围、奖励系数等。这促进了配置与代码的分离。
构建场景 (MjScene)：在环境类的__init__方法中，加载MJCF模型，并可能通过代码动态添加或修改场景元素（如随机生成的目标物体）。
设置管理器 (Managers)：初始化负责特定功能的管理器，如RandomizationManager（用于域随机化）、EventManager（处理重置事件）等。
实现核心方法：详细说明如何编写_setup_observations（设置观测）、_pre_physics_step（应用动作）、_compute_rewards、_compute_terminated等方法。
注册任务：最后，如何将新任务类注册到MJLab的框架中，使其可以通过字符串标识符被创建。

3.2.2 API速查与范例优先 (references/mjlab-api-*.md,references/mjlab-authoring-recipes.md)为了避免开发者或AI助手过度依赖可能过时的在线文档，技能包内置了精选的、针对核心领域的API参考。更重要的是，它确立了“范例优先”的原则。

实操心得：在指导AI助手时，我们明确要求它首先搜索并参考项目本地mjlab/tasks/目录下的官方示例代码，其次是技能包内捆绑的参考片段，最后才是查阅在线文档。这是因为官方示例代表了当前版本最权威、最稳定的用法。直接让AI模仿这些示例的代码风格和结构，能最大程度避免因误解文档而产生的错误。

3.2.3 网格与资产导入指南 (references/mjlab-mesh-import-guidelines.md)机器人仿真离不开3D模型。这份指南解决了从常见3D格式（如STL, OBJ, FBX）导入网格到MJCF的关键问题：

单位与比例：提醒检查并统一网格文件的单位（米、厘米、毫米），确保在MJCF中尺寸正确。
材质与纹理：解释如何在MJCF中定义材质(material)和贴图(texture)，并关联到几何体(geom)。
碰撞体简化：对于视觉上复杂但用于碰撞的网格，强烈建议使用简化后的凸包或基本几何体（如盒子、球体、胶囊）来代替，以大幅提升碰撞检测性能。
惯性参数：如果网格代表一个刚体，必须为其定义合理的质量(mass)和惯性矩(inertia)。指南提供了估算这些参数的实用方法。

4. 安装、配置与多工具适配实操

4.1 安装脚本深度使用指南

项目提供的install.sh脚本是入口，它设计得非常用户友好，支持交互式(TUI)和命令行(CLI)两种模式。

4.1.1 交互式安装模式详解运行bash scripts/install.sh后，你会进入一个基于终端的文本用户界面。这个界面使用简单的键盘导航：

使用↑/↓键在工具列表（Codex, Claude Code, Gemini CLI, Cursor, OpenCode）间移动。
按空格键可以选中/取消选中某个工具，实现多选。
安装方法有两种：copy（复制）和symlink（符号链接）。通常，对于生产环境或希望独立使用技能包，选择copy。如果你正在参与mjlab-skillkit项目的开发，频繁修改规则文件，并希望改动立刻在所有工具中生效，那么选择symlink（创建软链接）是更高效的方式。同样用空格键切换方法。
按回车键确认安装，脚本会显示即将安装到的目标路径，再次确认后执行。
按Q键随时退出。

这个TUI对于不熟悉命令行参数的用户来说非常直观。

4.1.2 命令行模式与高级参数对于自动化脚本或喜欢精准控制的用户，CLI模式更强大。

# 基础安装：安装到Claude Code bash scripts/install.sh --tool claude # 批量安装：一次性安装到所有支持的AI助手 bash scripts/install.sh --tool all # 开发模式：使用符号链接，方便调试规则 bash scripts/install.sh --tool cursor --method symlink # 项目级安装：将技能包安装到特定Cursor项目的本地规则目录 bash scripts/install.sh --tool cursor --project /path/to/your/mjlab-project

重要提示：--project参数对于Cursor和OpenCode这类支持项目级配置的工具特别有用。这意味着你可以为不同的MJLab项目配置不同的技能包版本或规则，实现了配置的隔离性。全局安装（默认）则对所有项目生效。

4.1.3 安装路径解析与验证了解文件被安装到哪里，对于调试和手动管理很重要。脚本会根据工具类型和参数，将文件复制或链接到以下位置：

工具	安装位置（全局）	说明
Codex	`~/.codex/skills/mjlab-skillkit/`	依赖于`CODEX_HOME`环境变量，默认为用户目录。
Claude Code	`~/.claude/rules/mjlab-skillkit.md`	单个Markdown规则文件。
Gemini CLI	`~/.gemini/rules/mjlab-skillkit.md`	单个Markdown规则文件。
Cursor	`~/.cursor/rules/mjlab-skillkit.mdc`	全局规则文件。若指定`--project`，则安装到项目下的`.cursor/rules/`目录。
OpenCode	`~/.config/opencode/skills/mjlab-skillkit/`	技能目录。也支持项目级的`.opencode/skills/`目录。

安装完成后，一个简单的验证方法是：打开对应的AI助手，在一个MJLab相关的文件中，尝试问一个技能包覆盖的问题，例如“MJLab中如何创建一个新的任务类？”，观察AI的回复是否引用了技能包中的结构化内容，而非通用的网络回答。

4.2 不同AI助手的适配原理与效果

虽然核心知识相同，但不同AI助手对“技能”或“规则”的利用方式有差异。技能包通过适配器来优化这种体验。

对于Cursor (.mdc文件)：Cursor的规则文件支持一种特定的指令语法，如@context、@rules。适配器会将核心规则库的内容，按照Cursor偏好的章节结构和指令进行重新组织，并可能添加一些Cursor特有的触发关键词，使得在编辑相关文件时，AI能更主动地提供建议。
对于Claude Code/Gemini CLI (.md文件)：这些工具通常将整个Markdown文件作为增强的上下文。适配器会确保文档结构清晰，包含大量代码块和具体示例，方便AI在回答时进行引用。它可能还会在文件开头添加一个简明的“使用说明”，指导用户如何向AI提问以获得最佳效果（例如，“当你需要迁移Isaac Lab任务时，请提及‘使用迁移技能’”）。
对于Codex (OpenAI Agent viaagents/openai.yaml)：这里采用了OpenAI智能体（Agent）的配置方式。YAML文件定义了智能体的指令（instructions）、知识库引用（可能指向本地的规则文件）以及可供调用的函数（虽然本项目未定义具体函数，但预留了结构）。这种方式将技能包提升到了“智能体行为模式”的层面，AI的行为会更具有导向性。

5. 实战应用：从迁移到创作的完整流程

5.1 案例：迁移一个Isaac Lab的机械臂到达任务

假设我们有一个Isaac Lab的FrankaReach任务，目标是控制Franka机械臂的末端执行器到达一个随机生成的目标位置。

步骤1：环境与任务分析首先，使用Isaac Lab迁移技能，让AI助手帮助我们分析原任务。我们可以向AI提供原任务的关键代码片段，并提问：“请根据迁移技能，分析这个Isaac Lab任务的以下组件：1) 观测空间；2) 动作空间；3) 奖励函数；4) 终止条件；5) 场景初始化逻辑。”

AI助手在技能包的加持下，会识别出：

观测：可能包含关节位置、速度，末端执行器位置，目标位置。
动作：可能是关节位置控制或关节速度控制。
奖励：很可能基于末端与目标的距离，如reward = exp(-alpha * distance)。
场景：包含一个Franka机器人模型和一个目标视觉标记。

步骤2：MJLab场景重建接下来，聚焦场景。提问：“如何在MJLab中重建一个类似的场景？需要包含一个Franka Panda模型和一个表示目标的可视球体。” AI会参考技能包中的mesh-import-guidelines和authoring-recipes，给出建议：

获取Franka Panda的MJCF模型文件（通常来自官方资产库）。
在MJCF文件的<worldbody>内，添加一个自由浮动的球体几何体作为目标，并为其定义一个站点（<site>）以便在代码中访问其位置。
可能需要调整机器人的初始姿态。

步骤3：任务类迁移这是核心。提问：“现在，请根据之前的分析，编写一个MJLab原生的ReachEnv任务类框架。请遵循mjlab-authoring-workflow中定义的步骤。” AI会生成一个包含以下骨架的代码：

import mjlab from mjlab.tasks import MjEnv from your_config_module import ReachEnvCfg # 假设你已定义配置 class ReachEnv(MjEnv): def __init__(self, cfg: ReachEnvCfg, **kwargs): super().__init__(cfg, **kwargs) # 初始化场景、管理器等 self._target_site_id = self.scene.model.site("target_site").id self._end_effector_site_id = self.scene.model.site("ee_site").id def _setup_observations(self): # 配置观测：关节状态、末端位置、目标位置等 obs_dict = {...} return obs_dict def _pre_physics_step(self, actions: torch.Tensor): # 将动作（如关节目标位置）应用到机器人 self.articulation.set_joint_position_target(actions) def _compute_rewards(self): # 计算基于距离的奖励 ee_pos = self.scene.data.site(self._end_effector_site_id).xpos target_pos = self.scene.data.site(self._target_site_id).xpos distance = np.linalg.norm(ee_pos - target_pos) reward = np.exp(-self.cfg.reward_scale * distance) return reward def _compute_terminated(self): # 判断是否成功或失败 distance = ... # 同上计算距离 terminated = distance < self.cfg.success_threshold return terminated def reset(self, seed=None, options=None): # 重置环境，随机化目标位置 obs = super().reset(seed, options) # 随机设置目标站点的位置 self.scene.data.site(self._target_site_id).xpos = random_target_pos return obs

在这个过程中，AI会不断引用技能包中的具体规则，例如“在_pre_physics_step中应用动作时，注意MJLab的set_joint_position_target与Isaac Lab API的差异”。

步骤4：调试与验证最后，利用技能包中的checklist.md和migration-gotchas.md，让AI协助进行系统性检查。例如：“请根据迁移检查清单，列出在完成上述代码后需要验证的5个关键点。” AI可能会回复：

仿真步长(dt)是否设置正确，与控制频率匹配？
观测值的尺度（归一化）是否与原始任务一致？
奖励函数的形状和尺度是否会导致训练不稳定？
随机重置的范围是否合理，避免目标出现在不可达位置？
机器人的关节限位和扭矩限制是否在MJCF中正确定义？

5.2 案例：从零创建MJLab四足机器人行走任务

对于原生创作，流程更侧重于学习和模仿。

步骤1：寻找并分析范例首先，利用“范例优先”原则。提问：“MJLab中是否有官方的四足机器人任务示例？请分析其任务配置(EnvCfg)、观测空间和奖励函数的设计。” AI会在技能包的引导下，搜索本地mjlab/tasks目录（如果存在），或引用技能包内嵌的示例片段，向你展示一个类似QuadrupedWalk任务的结构。

步骤2：定义自己的配置和任务骨架基于范例，开始创作。提问：“我想创建一个名为MyQuadrupedEnv的任务，让一个Unitree Go1机器人学习行走。请帮我编写一个基础的EnvCfg和任务类__init__方法。” AI会生成一个包含机器人模型路径、奖励权重（如前进速度奖励、姿态惩罚、能量消耗惩罚）、地形参数等配置的数据类，以及一个加载对应MJCF模型、初始化关键站点ID和关节索引的__init__方法。

步骤3：实现核心逻辑逐步实现各个部分。可以分步提问：

“如何在这个环境中计算前进速度作为奖励的一部分？”
“如何添加一个对机身俯仰角和滚转角的惩罚项，以保持姿态稳定？”
“如何设置观测空间，包含关节状态、机身姿态、足端接触状态等？” 对于每个问题，AI都会参考技能包中的authoring-recipes和api-reference，给出符合MJLab惯例的实现代码。

步骤4：集成训练配置最后，提问：“如何为这个任务配置一个PPO训练流程？请给出一个基本的训练脚本片段。” 此时，AI会切换到技能包中关于RL配置的部分，提供一个使用MJLab训练器（如果框架提供）或与第三方库（如RLlib、Stable-Baselines3）集成的示例配置，包括网络架构、学习率、并行环境数等关键超参数的建议起点。

6. 常见问题、排查与项目维护

6.1 安装与使用常见问题

Q1: 安装脚本执行失败，提示“权限被拒绝”或“目录不存在”。A1:这通常是因为目标安装目录不存在或当前用户没有写入权限。

检查目录：首先确认AI助手是否已安装并创建了其配置目录（如~/.cursor）。有时需要先运行一次AI助手来初始化这些目录。
权限问题：对于全局安装，确保你对用户主目录有写入权。对于项目级安装，确保你对项目目录有写入权。可以尝试手动创建缺失的目录，例如mkdir -p ~/.cursor/rules。
使用符号链接：如果使用symlink方法失败，可能是源路径（技能包目录）或目标路径有问题。尝试使用绝对路径进行安装。

Q2: 安装成功后，AI助手似乎没有使用技能包的内容。A2:不同AI助手启用规则/技能的方式不同。

Cursor：规则通常是自动加载的。但请检查Cursor的设置，确保“Enable Rules”是打开的。你也可以在编辑文件时，查看Cursor的Companion面板，看是否有激活的规则提示。
Claude Code / Gemini CLI：这些工具可能需要你手动在对话中“激活”或引用规则文件。尝试在提问时明确说明，例如“请参考mjlab-skillkit规则来回答”。
全局 vs 项目级：如果你安装了项目级规则，但在一个新打开的、非该项目目录下的文件中提问，AI可能不会应用该规则。确保你在正确的项目上下文中工作。

Q3: 技能包的内容似乎没有更新，AI还在引用旧的信息。A3:AI助手有上下文缓存机制。

重启AI助手：完全关闭并重新打开你的IDE或AI助手客户端。
清除缓存：查阅你所使用AI助手的文档，看是否有清除上下文缓存或重新加载规则的选项。
确认安装方法：如果你以copy方式安装，之后更新了mjlab-skillkit源码，需要重新运行安装脚本。如果使用symlink，则更新源码后应立即生效（前提是AI助手重新读取了文件）。

6.2 迁移与开发中的典型技术问题

Q1: 迁移后，机器人行为“抽搐”或不稳定。A1:这是最常见的问题之一，原因多样。

首要怀疑：仿真步长(dt)：比较原Isaac Lab任务和MJLab环境中的dt值。如果不一致，需要按比例缩放所有与时间相关的参数，尤其是控制器增益（Kp, Kd）和速度/加速度计算。将MJLab的dt调整为与Isaac Lab一致通常是首选方案。
动作空间缩放：检查动作值的范围。Isaac Lab和MJLab对归一化动作的解释可能不同。确保你的动作在应用到关节之前，被正确地缩放到了机器人的实际控制范围（如位置控制时的关节角度范围）。
物理参数差异：检查MJCF模型中的关节阻尼(damping)、摩擦(frictionloss)等参数是否与原始模型匹配。这些细微差别会显著影响动力学。
奖励尺度爆炸：如果奖励函数中包含了距离的倒数或平方项，在距离很小时可能导致奖励值巨大，进而造成梯度爆炸。考虑使用更平滑的函数，如exp(-distance)或1/(1+distance)。

Q2: 在MJLab中导入自定义网格后，仿真速度极慢。A2:这几乎总是因为碰撞网格过于复杂。

简化碰撞体：绝对不要将用于视觉的高精度网格直接用作碰撞体。在MJCF中，为<geom>指定一个简单的type="box"、type="sphere"或type="capsule"，或者使用convexhull类型并提供一个预先计算好的、顶点数少得多的凸包网格文件。
检查网格数量：如果一个物体由很多小网格组成，考虑将其合并为一个或少数几个网格。
使用MuJoCo的编译选项：在加载模型时，可以尝试设置一些优化标志，但最根本的解决方案还是简化碰撞几何。

Q3: 训练时发现智能体没有学到任何东西，奖励不上升。A3:这属于强化学习调试的范畴，但技能包能提供一些框架层面的检查点。

观测值是否合理？：在环境重置后第一步，打印出观测值，检查其范围、是否存在NaN或Inf。确保观测空间的定义与网络输入层匹配。
奖励函数是否可微分？：虽然环境奖励函数不需要严格可微，但过于不平滑或稀疏的奖励会难以学习。确保你的奖励函数能提供足够密集的、有意义的反馈。
动作是否生效？：在_pre_physics_step中打印出应用的动作值，并在下一步读取关节的实际位置/速度，验证控制命令被正确执行。
重置逻辑是否正确？：确保每次reset都真正将环境恢复到一个有意义的初始状态，特别是随机化的部分（如目标位置、机器人初始姿态）是否在合理范围内。

6.3 项目维护与扩展建议

mjlab-skillkit本身也是一个需要维护的项目。随着MJLab框架的更新，其API和最佳实践可能会演变。

保持与上游MJLab同步：定期检查MJLab的官方文档、示例代码和发布说明。如果发现重大API变更或新的推荐模式，应及时更新技能包中的references/mjlab-api-*.md和references/mjlab-authoring-workflow.md等文件。
收集社区案例：在迁移和创作过程中，你会和团队积累新的“模式”和“陷阱”。建议将这些经验整理成新的patterns或gotchas，通过Pull Request贡献回项目，使其更加丰富。
适配新的AI助手：当有新的、流行的AI编码助手出现时，可以参照现有的adapters/目录结构，为其编写一个新的适配器脚本和规则格式文件，扩展技能包的适用范围。
版本化与发布：使用项目自带的package.sh脚本进行版本打包和发布。清晰的版本号有助于用户追踪变化。在发布新版本时，更新PROMO.md中的说明，清晰地传达新增内容和重大变更。