当Claude code有了长期记忆，一切都不一样了！-编程阁

这篇东西写起来有点随意，就当跟朋友聊聊吧。

先说说我是怎么发现这个项目的。

那天我在做一个量化策略的回测系统，连着跟 Claude Code 聊了大概三四个小时，把数据清洗的逻辑调得差不多了。然后我去吃了个饭，回来重新开了个 session——

它什么都不记得了。

我当时的表情大概是这样的：🙂

不是那种很愤怒的感觉，就是那种……你知道吗，就好像你跟一个很聪明的实习生讲了半天，他说「好的好的我明白了」，然后去厕所溜达了一圈回来，满脸无辜地问你「我们刚才说到哪里了」。

这种感觉。

然后我就去找有没有什么解决方案，找到了 [claude-mem]。

顺便说一下，国内订阅claude code不是这么方便，推荐这个网点订阅：claudemax.shop

这玩意儿到底是啥

说白了，claude-mem 就是给 Claude Code 装了一个可以跨 session 持久化的记忆系统。

它会自动捕获你每次 coding session 里发生的一切——Claude 用了哪些工具、做了哪些决策、遇到了什么问题、怎么解决的——然后用 AI 压缩成语义摘要，存到本地数据库里。下次你开新 session，它就把相关的上下文自动注入回来。

听起来很简单对吧？但工程量其实不小，1823 个 commits，当前版本 v12.4.9（今天是 2026-04-30，上午刚刚发布的），69,800+ stars，这个迭代速度我只能说……这作者是不是也给自己装了什么记忆增强插件。

安装方式嘛，一行命令搞定：

npx claude-mem install

或者在 Claude Code 里面直接：

/plugin marketplace add thedotmack/claude-mem /plugin install claude-mem

就这样，重启一下，它就开始默默工作了。完全不需要你手动干预任何东西，这一点我挺喜欢的。

它在底层做了什么——这部分稍微技术一点，跳过也行

我这个人有个毛病，就是看到什么东西都想翻翻底层实现。

claude-mem 的核心架构是这样的：

5 个生命周期 Hook：SessionStart、UserPromptSubmit、PostToolUse、Stop、SessionEnd。就是在这些关键节点把数据捕获下来。

Worker Service：一个跑在 37777 端口的 HTTP 服务，用 Bun 管理，提供 10 个搜索接口，还有个 Web Viewer UI 可以实时看记忆流。打开http://localhost:37777就能看到，有点像给 AI 的「意识流」装了个监控面板，感觉……稍微有点赛博朋克。

SQLite + Chroma 向量数据库：SQLite 存结构化数据和 FTS5 全文检索，Chroma 做语义向量搜索。这个混合检索架构挺聪明的，能在语义相似度和关键词精确匹配之间做平衡。

搜索这里有个我觉得设计得挺好的地方，叫3层工作流：

先用search拿一个精简索引（每条结果大概 50-100 个 token）
用timeline看某个观测点前后的时间线上下文
最后才用get_observations拿完整详情（这时候才花大 token）

这个「先查索引再拿详情」的设计，节省了大概10 倍的 token 消耗。做金融的我看到这种「先筛选再全量」的思路感觉很亲切，本质上跟数据库查询优化是一个道理——你不会先把整张表 SELECT * 出来再 filter 吧？

我实际用下来感受怎么样

说几个真实场景。

场景一：长周期项目

我有个 FinTech 项目断断续续做了一个多月，中间各种打断，各种「啊这个逻辑我为什么这么设计来着」。装了 claude-mem 之后，每次开新 session，它会把相关的历史上下文自动带进来。比如我上次调试过某个数据清洗的边界情况，这次再提到类似问题，它是知道的。

这个体验怎么形容呢——就像从跟一个健忘的实习生合作，升级成了跟一个有笔记本的老同事合作。

场景二：隐私控制

这个功能我挺在意的——你可以用<private>标签来标记不想被记录的内容。做金融的对数据隐私多少有点职业敏感，这个设计让我稍微放心了一点。

场景三：多语言模式

它支持CLAUDE_MEM_MODE配置，可以切换中文模式（code--zh），生成的记忆摘要直接是中文的，读起来方便很多。

说几个不那么完美的地方

你懂的，我不太喜欢只讲好话。

Bun 和 uv 的自动安装有时候会卡。第一次装的时候它要自动安装 Bun（JavaScript 运行时）和 uv（Python 包管理器），如果网络不好或者环境有点特殊，这一步可能会卡住或者报奇怪的错误。不是大问题，重试一般能过，但第一次体验不够丝滑。

Windows 用户有点费劲。README 里有专门的 Windows 说明，但感觉不是一等公民。WSL2 里跑会顺畅很多。

$CMEM 这个事情……。README 最后有一段说有人在 Solana 上发了个叫 $CMEM 的 token，然后作者说「是第三方发的，但我官方拥抱了它」。我第一次看到这段直接愣了三秒。倒不是说这有什么问题，只是……这种 AI 工具和 meme coin 的组合让我有一丝丝迷惑。当然这跟工具本身没关系，纯属聊斋。

内存占用不算小。Worker 服务加上 Chroma 跑起来，内存消耗比我预期的要多一点。如果你的机器配置一般，可能需要注意一下。