news 2026/6/10 18:52:32

Verl中的checkpoint合并成huggingface形式的模型

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Verl中的checkpoint合并成huggingface形式的模型

这里用的fsdp训练的模型,大概内容如下:

里面打开还是有很多文件

现在想要hf那个格式的模型,VeRL提供了merge函数,下面是一个代码:具体参考https://verl.readthedocs.io/en/latest/advance/checkpoint.html#checkpoint-page

#!/bin/bash # 合并 PPO 训练的 checkpoint 为 HuggingFace 格式 # Checkpoint 路径:/root/autodl-tmp/verl/checkpoints/verl_example_gsm8k/deepseek_llm_7b_function_rm/global_step_105 set-x # 设置 Hugging Face 缓存目录 export HF_HOME=/root/autodl-tmp export TRANSFORMERS_CACHE=/root/autodl-tmp # Checkpoint 路径 CHECKPOINT_DIR="/root/autodl-tmp/verl/checkpoints/verl_example_gsm8k/deepseek_llm_7b_function_rm/global_step_105"ACTOR_DIR="${CHECKPOINT_DIR}/actor"# 输出目录(合并后的 HuggingFace 模型) TARGET_DIR="${CHECKPOINT_DIR}/merged_hf_model"# 执行合并 python-m verl.model_merger merge \--backend fsdp \--local_dir"${ACTOR_DIR}"\--target_dir"${TARGET_DIR}"echo"合并完成!模型已保存到: ${TARGET_DIR}"

合并后的模型如下:

后记

2025年12月12日于上海。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 12:29:24

精通CtrlP正则搜索:7个高效模式匹配技巧深度解析

精通CtrlP正则搜索:7个高效模式匹配技巧深度解析 【免费下载链接】ctrlp.vim 项目地址: https://gitcode.com/gh_mirrors/ctr/ctrlp.vim CtrlP.vim作为Vim生态系统中功能最强大的模糊文件查找插件,其正则表达式搜索功能为开发者提供了前所未有的…

作者头像 李华
网站建设 2026/6/10 14:04:42

oceanbase基础概念和语法介绍

OceanBase 是由蚂蚁集团自主研发的分布式关系型数据库,兼容 MySQL 和 Oracle 模式,具备高可用、强一致性、水平扩展、HTAP(混合事务/分析处理)等能力。以下是其核心基础概念与常用语法介绍。 一、OceanBase 核心架构与基础概念 1…

作者头像 李华
网站建设 2026/6/10 1:50:36

Wan2.2-T2V-A14B在动漫分镜脚本预演中的生产力提升效果

Wan2.2-T2V-A14B在动漫分镜脚本预演中的生产力提升效果 在当代动漫创作中,一个看似简单的镜头——比如主角从高楼跃下、衣袂翻飞、背景城市光影流动——背后往往需要原画师反复推敲构图、动画师逐帧调试动作轨迹,整个过程耗时数小时甚至数天。而如今&…

作者头像 李华
网站建设 2026/6/10 15:22:12

数字员工如何借助AI销冠系统实现销售业绩优化?

数字员工在现代企业中扮演着至关重要的角色,尤其是在优化业务流程和降低成本方面。通过与AI销冠系统的整合,数字员工能够有效地进行客户沟通,实现全天候服务,减少人工客服的需求。此类系统不仅提高了客户触达率,还通过…

作者头像 李华