news 2026/5/6 6:15:14

大模型自改进架构入门到精通:搞懂Meta HyperAgents,死磕这篇就够了!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型自改进架构入门到精通:搞懂Meta HyperAgents,死磕这篇就够了!

大多数自我改进的AI系统都在撞同一面“墙”——改进机制固定,无法实现自我加速。

或者只能在编程领域实现AI的持续自我提升,比如达尔文-哥德尔机制(DGM),在编程之外就做不到了。就像一位物理学家能在物理领域发光发热,而在歌唱领域其学习和解决问题的能力就无法迁移了。

Meta及其合作者的最新论文《HyperAgents》成果突破了这一局限,他们引入了自参考(self-referential)Agent。负责干活的任务Agent和负责想办法改进的元Agent集成到了同一个系统之中。

于是,Agent拥有了自主修改“改进机制”的超能力,其学习和解决问题的能力可于不同领域之间转移。

曾在Meta AI工作过的博主elvis评价:“这是今年关于自改进Agent方面最有趣的文章之一。”

还有人评论道:“这基本上是将瓶颈提升了一个层次,从’Agent能改进吗?‘→’改进系统本身能否进化?’”

HyperAgents为什么能自改进演化?

这要从DGM说起,这个只能在编程领域进行自改进的AI系统依赖于一个关键假设:解决问题和自我修改的手段必须保持一致。也就是既要写代码干活和又要写代码提升,同时其改进的逻辑是由人类预先确定的,不可更改。

HyperAgents将一个程序拆分为两个角色,并集成在同一个可编辑的 Python 程序。任务智能体专门负责解决目标任务。元智能体专门负责修改代码,包括修改任务智能体的逻辑,以及修改它自己的逻辑。

当任务技能不需要和改进技能保持一致时,这就意味着AI系统可以干着不同领域的活,同时还能自我改进。也就是DGM被扩展了,这种新系统在论文中被定义为DGM-Hyperagents (DGM-H)。

实验结果表明,通过在论文审稿和机器人奖励设计任务训练的HyperAgents,转移用于奥林匹克数学评分任务,测试得分0.630,而原始DGM得分为0。这证明HyperAgents的改进能力是可积累和可转移的,它确实拥有了跨领域泛化的问题解决能力。

HyperAgents的自改进演化过程

HyperAgents 的进化过程像极了生物演化:AI系统维持一个不断增长的智能体存档,就像一个智能体的“种群”。在档案中选择表现优秀的“父辈”智能体,让元智能体对其代码进行变异。只有在测试中表现更好的变体,才能进入档案库,成为下一代进化的“基石”。

在这个过程中,HyperAgents 甚至会自主创新,开发出一些人类没想到的“黑科技工具”。比如“性能监测类”工具,能够自动记录、跟踪、分析自己在多次迭代中的性能表现。还有“持久化记忆”工具,使学习能够跨迭代积累。这都极大地加速了进化效率。

HyperAgents不仅记录数值分数,还存储综合洞见、因果假设和前瞻性计划(例如识别哪些世代表现最佳,诊断过度修正,并提出如何组合成功策略)。这些记忆在后续自我修改步骤中会被积极参考,使后代能够基于早期发现继续发展,避免重蹈覆辙。

自主加速会带来什么,局限有哪些

正如文中所言

DGM-Hyperagents让我们瞥见开放式AI系统:它们不只是寻找更好解,而是持续改进“寻找解的方法”。

这项研究展现出AI系统无限开放式自我改进的可能性,为自主加速技术进步提供了新范式。

当AI被允许主导自我进化,这预示着AI研发可能将从人力驱动转向自主加速,技术突破的周期将极大缩短。同时,不依赖特定任务数据而能够跨领域能力迁移,可能是实现AGI的新路径。

然而,如果一个系统可以修改自己的底层逻辑,传统的“护栏”可能失效。假如评估标准设计不当,AI 可能会学会“刷分”和“作弊”。无人类监督的AI系统其风险性极大上升。

此外,“固定的任务分布运行”和“开放式探索循环的组成部分保持固定”仍局限了AI系统完全的自我改进能力,即需要解决的任务难度是否能随着HyperAgent的能力提升而提升,与自我改进循环中的“父母选择”和“评估协议”环节是否也能更改,这些问题仍静待着研究者们去探索和思考。

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 20:47:38

HyperMesh文件操作与面板功能实战指南:从基础到高效应用

1. HyperMesh文件操作基础:从零开始掌握核心功能 第一次打开HyperMesh时,那个布满按钮的界面确实容易让人发懵。记得我刚接触这个软件时,光是找保存按钮就花了十分钟。不过别担心,文件操作其实就像我们平时用Word一样简单&#xf…

作者头像 李华
网站建设 2026/4/18 3:06:22

如何利用AWR预测表空间增长_分析Segment历史容量评估未来扩容

AWR历史表空间分析依赖DBA_HIST_TBSPC_SPACE_USAGE中压缩的块数数据,需关联DBA_TABLESPACES换算为GB;用REGR_SLOPE拟合30天内日均增长,TRUNC(RTIME)归一化日期防溢出;SYSAUX暴涨多因WRH$_ACTIVE_SESSION_HISTORY积压,删…

作者头像 李华
网站建设 2026/4/17 19:03:27

work_mem: 这是一个陷阱!

work_mem: 这是一个陷阱! 摘要 本文探讨了一个 PostgreSQL 内存问题,尽管 work_mem 仅设置为 2 MB,但某个查询却消耗了 2 TB 的 RAM。根本原因在于 PostgreSQL 的内存上下文系统,该系统只在查询执行结束时释放内存,而…

作者头像 李华
网站建设 2026/4/17 20:02:51

国产代码托管平台Gitee的崛起:本土化优势如何重塑企业研发协作生态

在数字化转型浪潮席卷各行各业的当下,代码托管与项目管理工具已成为企业研发效能提升的关键基础设施。随着国内企业对数据主权、安全合规和本地化服务需求的持续升温,以Gitee为代表的本土平台正在改写由国际巨头主导的市场格局。最新行业数据显示&#x…

作者头像 李华