大模型智能体记忆机制详解：短期记忆与长期记忆如何实现-编程阁

智能体的 Memory 中短期记忆（Short-term memory）与长期记忆（Long-term memory）是什么意思？有什么区别？

本文用相对通俗易懂的语言帮助大家来理解这两个概念，以及如何实现的？

在《LLM Powered Autonomous Agents》这篇文章中提到，大语言模型驱动的自主智能体中，大语言模型充当大脑，然后还有几个关键组件，如规划、工具、记忆。

其中记忆包括短期记忆和长期记忆。

短期记忆是智能体在单一会话中维护即时上下文的能力。

工作机制：它完全依赖于大模型（LLM）的上下文窗口。智能体会将之前的对话历史、中间推理步骤（如 Chain of Thought）放在 Prompt 中传给模型。
局限性：随着对话变长，旧的信息会因为超出窗口限制而被丢弃或“遗忘”。
常见处理：

滑动窗口：只保留最近的条对话。
摘要法：将之前的长对话总结成一段简短的摘要，释放窗口空间。

大模型的短期记忆其实是通过参数来维持的。我们是通过把对话的历史放在请求参数里，每次把前面的内容带上去，它才知道之前聊过什么。

拿 Cherry Studio 为例，不管是默认助手还是我们自定义的助手，在模型设置这里都可以看到「上下文数」。

我们第一个问题是：“你好”

注：点击 Cherry Studio 客户端窗口后按下快捷键 Ctrl + Shift + I（Mac端：Command + Option + I）可以打开控制台，查看请求过程。

我们第三个问题是“很好”

当我们问第四个问题：“不需要”时，我们可以看到我们第一个问题就被丢了！！！

这里的上下文轮数其实就是短期记忆的轮数。超过这个轮数的话，那么它就不会再发给大模型了。

有些朋友可能会问，那我们把上下文数设置长一点不就行了吗？

事情远没有想象的那么简单。

对于很多大模型来说，是按照输入和输出的 tokens 来计费的，上文越长越贵。截图来自；https://api-docs.deepseek.com/quick_start/pricing

对大多数模型来说，上下文越长，能力相对来说是会普遍下降的。

详情参见：https://research.trychroma.com/context-rot

由于短期是把聊天记录当做参数传过去，所以在不同的对话中无法自动共享一些关键信息。

长期记忆允许智能体存储、检索和利用过去跨越数天、数月甚至数年的信息。

技术实现：通常采用检索增强生成（RAG）技术。智能体将重要信息转化为向量（Embeddings）存入数据库。当需要时，通过语义匹配检索相关片段。
深度分类：

情境记忆 (Episodic Memory)：记录具体的“经历”。例如：“用户上周二在上海出差，提到过喜欢那里的咖啡”。
语义记忆 (Semantic Memory)：存储抽象的“事实”。例如：“用户对花生过敏”。
程序记忆 (Procedural Memory)：记录执行任务的“技能”或“SOP”。例如：智能体学会了如何使用某个特定的 API 接口。

拿 Cherry Studio 为例，长期记忆是通过“全局记忆”实现的。

你可以手动添加记忆，也可以在智能体里开启记忆。它就会把自己需要记忆的信息做判断，然后自动存储。

我们可以在整体设置这里打开全局记忆。

我们在和他们聊天的时候，它会先检索相关的记忆，然后再回答我们的问题。

如果它认为有些信息需要记住，也会自动保存到记忆中。

听着很完美，实际上还是会存在很多问题。

有时候记忆是 AI 自动决策的，没有和用户确认，那么这些记忆可能是错误的。
有了记忆之后，有些模型不够聪明，它有时会强行和相关记忆上靠，导致回答并不是我们想要的信息。

当我们开启全局记忆时，用户发起对话就会调用 Memory_Search 工具检索可能相关的记忆，并把它们放进上下文，帮助大语言模型更好地回答问题。

回答完成后，系统还会异步提取本次聊天的信息，如有需要增加、修改或删除的记忆，也会通过相应工具处理。

更多细节可 Cherry Studio 源码：https://github.com/CherryHQ/cherry-studio

简要来说，短期记忆是通过请求时传入对话历史来实现的，通常在对话内有效。长期记忆则是通过持久化存储，如向量数据库实现的，可以跨对话。

最后唠两句

为什么AI大模型成为越来越多程序员转行就业、升职加薪的首选

很简单，这些岗位缺人且高薪

智联招聘的最新数据给出了最直观的印证：2025年2月，AI领域求职人数同比增幅突破200% ，远超其他行业平均水平；整个人工智能行业的求职增速达到33.4%，位居各行业榜首，其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张，也让人才供需矛盾愈发突出。麦肯锡报告明确预测，到2030年中国AI专业人才需求将达600万人，人才缺口可能高达400万人，这一缺口不仅存在于核心技术领域，更蔓延至产业应用的各个环节。

那0基础普通人如何学习大模型？

深耕科技一线十二载，亲历技术浪潮变迁。我见证那些率先拥抱AI的同行，如何建立起效率与薪资的代际优势。如今，我将积累的大模型面试真题、独家资料、技术报告与实战路线系统整理，分享于此，为你扫清学习困惑，共赴AI时代新程。

我整理出这套 AI 大模型突围资料包【允许白嫖】：

✅从入门到精通的全套视频教程
✅AI大模型学习路线图（0基础到项目实战仅需90天）
✅大模型书籍与技术文档PDF
✅各大厂大模型面试题目详解
✅640套AI大模型报告合集
✅大模型入门实战训练

这份完整版的大模型 AI 学习和面试资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

①从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图（0基础到项目实战仅需90天）

全过程AI大模型学习路线

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了，这些是我精选出来的

④各大厂大模型面试题目详解

⑤640套AI大模型报告合集

⑥大模型入门实战训练

如果说你是以下人群中的其中一类，都可以来智泊AI学习人工智能，找到高薪工作，一次小小的“投资”换来的是终身受益！

应届毕业生‌：无工作经验但想要系统学习AI大模型技术，期待通过实战项目掌握核心技术。

零基础转型‌：非技术背景但关注AI应用场景，计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈：传统开发者（Java/前端等）学习Transformer架构与LangChain框架，向AI全栈工程师转型‌。

👉获取方式：
有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓