news 2026/6/10 17:32:51

curated-transformers 2.0.0 版本技术发布

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
curated-transformers 2.0.0 版本技术发布

✨ 新功能与改进

  • 通过 catalogue 注册模型,以在 Auto{Decoder,Encoder,CausalLM} 中支持外部模型。
  • 增加了对原地加载参数的支持。
  • 增加了对 ELECTRA 模型的支持。
  • 增加了对 HFHubRepository 进行写入/上传操作的支持。
  • 增加了将 Curated Transformer 配置转换为与某机构模型中心兼容的配置的支持。

🔴 错误修复

  • 支持 PyTorch 2.2。

⚠️ 向后不兼容变更

  • 移除了对 TorchScript 追踪的支持。
  • AttentionHeads、AttentionHeads.uniform、AttentionHeads.multi_query 和 AttentionHeads.key_value_broadcast 中的 qkv_split 参数现在变为必选参数。
  • 所有 FromHFHub 混入类已重命名为 FromHF。
  • 移除了 FromHF.convert_hf_state_dict 方法,取而代之的是 FromHF.state_dict_from_hf 方法。

👥 贡献者

由 danieldk、honnibal、ines、KennethEnevoldsen、shadeMe 提供。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 1:44:35

从“写不出来”到“写得像样”:一位科研新手在书匠策AI陪伴下完成首篇SCI投稿的真实心路与功能观察笔记

科研写作的困境,往往不在“不知道写什么”,而在“知道却写不好”。 作为刚结束硕士课题、首次尝试撰写英文期刊论文的“科研萌新”,我曾连续三周对着空白文档发呆——数据齐全、图表精美,但一到写Method或Discussion就卡壳。语法…

作者头像 李华
网站建设 2026/6/10 12:23:38

IDM激活脚本终极指南:3步免费解锁完整版下载神器

还在为IDM下载速度受限而烦恼?想要彻底告别30天试用期的困扰?这款开源IDM激活脚本汉化版就是你的完美解决方案!在100字内,让我为你介绍这个能够解除IDM使用限制、延长试用期、重置激活状态的强大工具,完全免费且操作简…

作者头像 李华
网站建设 2026/6/10 14:06:30

终极追剧神器:爱美剧Mac客户端的完整使用指南

终极追剧神器:爱美剧Mac客户端的完整使用指南 【免费下载链接】iMeiJu_Mac 爱美剧Mac客户端 项目地址: https://gitcode.com/gh_mirrors/im/iMeiJu_Mac 作为一名美剧爱好者,你是否经历过这样的烦恼:在深夜追剧时突然加载失败&#xff…

作者头像 李华