news 2026/5/2 2:21:14

Agent的记忆系统设计:短期/长期/向量三重记忆

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Agent的记忆系统设计:短期/长期/向量三重记忆
  1. ReAct
    全称Reasoning+Acting,即“先思考,再行动”。模型不直接生成最终答案,通过显式推理步骤判断是否调用外部工具(如搜索引擎、数据库等),再根据反馈继续推理与执行,直至完成任务。

优点是推理轨迹清晰,便于追溯;

最近两年,大家都可以看到AI的发展有多快,我国超10亿参数的LLM,在短短一年之内,已经超过了100个,现在还在不断的发掘中,时代在瞬息万变,我们又为何不给自己多一个选择,多一个出路,多一个可能呢?

学习AILLM是一项系统工程,需要时间和持续的努力。但随着技术的发展和在线资源的丰富,零基础的小白也有很好的机会逐步学习和掌握。

例如数据分析场景中,模型生成Python脚本用于生成表格、绘制图表,再输出执行结果。

  1. Agentic RAG
    在普通RAG(“召回-增强-生成”)基础上更具主动性:

相较传统RAG,事实性、一致性和上下文控制更优,适合企业内部知识问答、查阅最新资料等场景。

能降低Hallucination和推理错误概率,使输出更稳定可靠,但会增加计算开销和响应延迟,适用于对精准性、严谨性要求高的场景。

优势是扩展性强,复杂任务可分工协作、效率更高;缺点是架构复杂,易增加成本和延迟。

总结一下这5种常见的AIAgent设计模式:

CodeAct用代码执行任务,精准性高但对环境要求严;

Self-Reflection通过自我修正提升输出可靠性,不过耗时略增;

适合需要工具辅助的任务(查资料、跑数据库、复杂计算等;

缺点是推理链过长可能导致延迟上升,需限制循环步数。

与其在传统行业里停滞不前,不如尝试一下新兴行业,而AILLM恰恰是这两年的大风口,整体AI领域预计缺口1000万人,其中算法、工程应用类人才需求最为紧迫!

  1. CodeAct
    关键是将任务转化为可执行代码,运行后返回结果(如Manus架构)

相比自然语言回答,精准性和可复现性更高,但对执行环境要求高,需在隔离受控环境中运行以规避风险。

会根据问题选择召回策略、决定是否多次搜索、过滤重复结果,还能将高价值信息回写知识图谱库。

4.Self-Reflection
模型生成初稿后,自我审查评估并修正问题,得到更新版本。

5.Multi-Agent Planner
类似“多Agent协作系统”:大任务拆分为小任务,分配给不同Agent,最后整合结果。

适用于任务规模大、领域交叉多的场景(如综合性调研、复杂流程自动化等)

ReAct靠“思考+行动”结合工具完成任务,推理清晰但需控制步骤;

AgenticRAG比传统RAG更主动,擅长知识召回与更新;

Multi-Agent Planner靠多Agent分工协作处理复杂任务,效率高但架构较复杂。


开篇实战准备(30分钟搞定环境)

1. 环境要求(极简版)

  • Python 3.10 或 3.11(推荐Anaconda)
  • VS Code 编辑器(安装Python扩展)
  • 一个OpenAI账号(或国内通义千问、豆包等,后面代码可一键切换)

2. 一键安装工具

打开终端,复制粘贴运行:

pip install openai==1.35.0 streamlit==1.38.0 gradio==4.44.0 python-dotenv requests

3. API申请(2分钟)

  • 打开 https://platform.openai.com/api-keys
  • 创建新Key,复制保存到项目根目录新建的.env文件里:
OPENAI_API_KEY=sk-你的key在这里

4. 项目文件夹结构(直接复制)

ai_systems/ ├── .env ├── requirements.txt ├── qa_assistant.py # 项目1 ├── copy_generator.py # 项目2 ├── chatbot.py # 项目3 └── utils.py # 公共工具

把上面requirements.txt内容写成:

openai==1.35.0 streamlit==1.38.0 gradio==4.44.0 python-dotenv

环境搞定!下面我们直接上手项目。

为方便大家学习 这里给大家整理了一份详细的学习资料包 需要的同学 可以根据图片指示自取

极简原理速通(只讲项目必需的3个逻辑)

  • Prompt就是指令:大模型像一个超级听话的助手,你把需求写得越清晰,它输出越准。核心模板:角色 + 任务 + 格式 + 示例。
  • API调用三步:加载key → 创建client → 调用chat.completions.create(temperature=0.7控制创意度)。
  • UI交互:用Streamlit一行代码就能出网页(st.text_input + st.button + st.chat_message),零前端知识也能做。

记住这三点就够了,下面直接开干!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/14 14:41:10

异常检测算法详解:从“何为异常”到“如何发现”

文章目录引言:一个根本性问题一、 认知框架:异常检测的两种世界观二、 统计与分布方法:用数学模型定义常态1. 3σ 原则/Z-Score:正态分布作为“标准模具”2. 箱线图法:让数据自己定义身体三、 基于距离/密度的方法&…

作者头像 李华
网站建设 2026/4/14 14:39:04

OpenCore Legacy Patcher终极指南:5步让老旧Mac焕发新生的完整教程

OpenCore Legacy Patcher终极指南:5步让老旧Mac焕发新生的完整教程 【免费下载链接】OpenCore-Legacy-Patcher Experience macOS just like before 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher 还在为苹果官方停止支持的老旧…

作者头像 李华
网站建设 2026/4/15 22:34:56

如何免费解锁加密音乐:Unlock Music完整使用指南

如何免费解锁加密音乐:Unlock Music完整使用指南 【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库: 1. https://github.com/unlock-music/unlock-music ;2. https://git.unlock-music.dev/um/web 项目地址: https://gi…

作者头像 李华