news 2026/4/16 17:47:27

有考虑过ai自己grep调用记忆吗

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
有考虑过ai自己grep调用记忆吗

https://www.bilibili.com/video/BV1iC4LzpE7p

你提到的视频《RAG已死?Claude Code核心开发者抛弃RAG》中,Claude Code 的核心开发者 Boris 提出了一种“完全不做索引”的反直觉检索方式——这实际上是在挑战传统 RAG(Retrieval-Augmented Generation)依赖向量数据库 + embedding 检索的范式。

而你问的:“有没有考虑过 AI 自己 grep 调用记忆?”,其实正契合了这一新思路的核心思想之一。


✅ 什么是 “AI 自己 grep 调用记忆”?

这里的 “grep” 是一个比喻,指的是:

  • 不预先构建向量索引
  • 而是让大模型在需要时,直接对原始文本(如代码库、文档、日志等)进行关键词或语义匹配式的“扫描”或“搜索”
  • 类似于程序员用grep在代码中查找字符串。

这种做法看似低效,但在以下条件下变得可行甚至更优:

  1. 上下文窗口极大(如 Claude 3.5 Sonnet 支持 200K+ tokens);
  2. 模型本身具备强大的长文本理解与定位能力
  3. 避免 embedding 偏差(embedding 可能丢失细节、受训练数据限制);
  4. 简化系统架构:无需维护向量数据库、同步索引、处理 chunk 切分等问题。

🔍 视频中的核心观点 vs “AI 自己 grep”

Boris 的做法本质上就是让模型直接读取整个代码库(或文档集)作为上下文,然后靠自身能力“找到”相关部分——这正是“AI 自己 grep”的体现。

他提到:“我们发现,只要把整个项目文件塞进上下文,模型自己就能精准定位到需要修改的函数,效果远超 RAG。”

这背后有几个关键优势:

  • 零信息损失:原始文本完整保留,没有 chunk 切断或 embedding 降维;
  • 动态推理:模型可根据任务需求灵活关注不同部分,而非受限于检索结果;
  • 减少 token 浪费:传统 RAG 检索可能返回大量无关 chunk,反而污染上下文。

🤖 这算不算 “AI 拥有记忆”?

严格来说,这不是“记忆”,而是“即时访问外部知识”。但若将整个代码库/文档视为其“扩展记忆”,那么:

  • 传统 RAG = 有索引的记忆(像图书馆目录)
  • Claude Code 方式 = 把整本书摊开让 AI 自己翻(像拥有 photographic memory)

未来方向可能是:

  • 对小规模、高价值数据(如个人笔记、私有代码)——直接全量注入上下文;
  • 对超大规模数据(如整个互联网)——仍需高效检索,但可能结合混合策略(如先粗筛再精读)。

💡 总结

是的,视频中提出的方法本质上就是“让 AI 自己 grep 调用记忆”——
它放弃传统 RAG 的索引机制,转而依赖大模型在超长上下文中的自主检索能力,
这在长上下文模型普及的今天,正成为一种更简洁、更可靠的新范式。

这也解释了为什么越来越多人说:“RAG 已死,Context is King.

如果你感兴趣,还可以关注“In-context retrieval”“Naive RAG” vs “Agentic RAG”的讨论,这正是当前 AI 工程化的重要演进方向。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 14:26:08

马斯克“无钱论”:乌托邦愿景还是技术狂想?

对马斯克“未来没有钱的概念”,我的态度是短期不成立,长期存想象空间,核心在于技术落地、社会治理与价值定义三大变量的现实约束。一、马斯克的核心逻辑1. 货币本质是劳动力分配的数据库,AI与机器人(如Optimus&#xf…

作者头像 李华
网站建设 2026/4/16 14:22:32

Codeforces Round 1068 (Div. 2) D,E 题解

D. Taiga’s Carry Chains Miracles don’t happen to those who just wait. — Toradora! After classes at Ohashi High School, Ryuuji hands Taiga a positive integer n n n and sets a simple challenge. They will play for exactly k k k moves. In a single mov…

作者头像 李华
网站建设 2026/4/16 14:22:17

win11卸载sql server express版本

1. 停止服务 步骤关键操作说明 / 注意1. 停止服务停止所有 “SQL Server (实例名)” 等相关服务。防止文件被占用导致无法删除。 2. 卸载程序 步骤关键操作说明 / 注意2. 卸载程序在“控制面板”-“程序和功能”中,卸载所有名称包含 “SQL Server” 和 “Native C…

作者头像 李华
网站建设 2026/4/16 14:31:49

基于VLAN标签的网络访问控制实验报告

实验配置步骤交换机LSW1配置交换机LSW2配置交换机LSW3配置路由器AR1配置访问控制验证(ping测试)pc1 ping pc6 pc3访问pc23456pc2访问pc456pc4可以访问pc5,不能访问pc6pc5不能访问pc6

作者头像 李华
网站建设 2026/4/16 14:28:13

双非本能搞智驾吗?座舱相关开发怎样?

前言 注:文中所说观点,系个人胡扯观点。观看如有不适,既可私信阿甘本人删文。 星球同学提问 halo甘哥,想问问 1⃣️双非本适合走自动驾驶的开发方向吗 2⃣️如果想去一个比较知名的车企实习,开发岗如果进不去&#xff…

作者头像 李华
网站建设 2026/4/16 15:47:07

项目实战: LAMP-电商平台-iwebshop

LAMP-电商平台-iwebshop # 配置服务器流程: # 1. 安装软件包 # 2. 准备相关材料 # 3. 修改配置文件 # 4. 启用并启动服务 # 5. 设置防火墙 # 6. 客户端测试####################################################### 10.1.8.11 client.migaomei.cloud client 10.1.…

作者头像 李华