这篇东西写起来有点随意,就当跟朋友聊聊吧。
先说说我是怎么发现这个项目的。
那天我在做一个量化策略的回测系统,连着跟 Claude Code 聊了大概三四个小时,把数据清洗的逻辑调得差不多了。然后我去吃了个饭,回来重新开了个 session——
它什么都不记得了。
我当时的表情大概是这样的:🙂
不是那种很愤怒的感觉,就是那种……你知道吗,就好像你跟一个很聪明的实习生讲了半天,他说「好的好的我明白了」,然后去厕所溜达了一圈回来,满脸无辜地问你「我们刚才说到哪里了」。
这种感觉。
然后我就去找有没有什么解决方案,找到了 [claude-mem]。
顺便说一下,国内订阅claude code不是这么方便,推荐这个网点订阅:claudemax.shop
这玩意儿到底是啥
说白了,claude-mem 就是给 Claude Code 装了一个可以跨 session 持久化的记忆系统。
它会自动捕获你每次 coding session 里发生的一切——Claude 用了哪些工具、做了哪些决策、遇到了什么问题、怎么解决的——然后用 AI 压缩成语义摘要,存到本地数据库里。下次你开新 session,它就把相关的上下文自动注入回来。
听起来很简单对吧?但工程量其实不小,1823 个 commits,当前版本 v12.4.9(今天是 2026-04-30,上午刚刚发布的),69,800+ stars,这个迭代速度我只能说……这作者是不是也给自己装了什么记忆增强插件。
安装方式嘛,一行命令搞定:
npx claude-mem install或者在 Claude Code 里面直接:
/plugin marketplace add thedotmack/claude-mem /plugin install claude-mem就这样,重启一下,它就开始默默工作了。完全不需要你手动干预任何东西,这一点我挺喜欢的。
它在底层做了什么——这部分稍微技术一点,跳过也行
我这个人有个毛病,就是看到什么东西都想翻翻底层实现。
claude-mem 的核心架构是这样的:
5 个生命周期 Hook:SessionStart、UserPromptSubmit、PostToolUse、Stop、SessionEnd。就是在这些关键节点把数据捕获下来。
Worker Service:一个跑在 37777 端口的 HTTP 服务,用 Bun 管理,提供 10 个搜索接口,还有个 Web Viewer UI 可以实时看记忆流。打开http://localhost:37777就能看到,有点像给 AI 的「意识流」装了个监控面板,感觉……稍微有点赛博朋克。
SQLite + Chroma 向量数据库:SQLite 存结构化数据和 FTS5 全文检索,Chroma 做语义向量搜索。这个混合检索架构挺聪明的,能在语义相似度和关键词精确匹配之间做平衡。
搜索这里有个我觉得设计得挺好的地方,叫3层工作流:
- 先用
search拿一个精简索引(每条结果大概 50-100 个 token) - 用
timeline看某个观测点前后的时间线上下文 - 最后才用
get_observations拿完整详情(这时候才花大 token)
这个「先查索引再拿详情」的设计,节省了大概10 倍的 token 消耗。做金融的我看到这种「先筛选再全量」的思路感觉很亲切,本质上跟数据库查询优化是一个道理——你不会先把整张表 SELECT * 出来再 filter 吧?
我实际用下来感受怎么样
说几个真实场景。
场景一:长周期项目
我有个 FinTech 项目断断续续做了一个多月,中间各种打断,各种「啊这个逻辑我为什么这么设计来着」。装了 claude-mem 之后,每次开新 session,它会把相关的历史上下文自动带进来。比如我上次调试过某个数据清洗的边界情况,这次再提到类似问题,它是知道的。
这个体验怎么形容呢——就像从跟一个健忘的实习生合作,升级成了跟一个有笔记本的老同事合作。
场景二:隐私控制
这个功能我挺在意的——你可以用<private>标签来标记不想被记录的内容。做金融的对数据隐私多少有点职业敏感,这个设计让我稍微放心了一点。
场景三:多语言模式
它支持CLAUDE_MEM_MODE配置,可以切换中文模式(code--zh),生成的记忆摘要直接是中文的,读起来方便很多。
说几个不那么完美的地方
你懂的,我不太喜欢只讲好话。
Bun 和 uv 的自动安装有时候会卡。第一次装的时候它要自动安装 Bun(JavaScript 运行时)和 uv(Python 包管理器),如果网络不好或者环境有点特殊,这一步可能会卡住或者报奇怪的错误。不是大问题,重试一般能过,但第一次体验不够丝滑。
Windows 用户有点费劲。README 里有专门的 Windows 说明,但感觉不是一等公民。WSL2 里跑会顺畅很多。
$CMEM 这个事情……。README 最后有一段说有人在 Solana 上发了个叫 $CMEM 的 token,然后作者说「是第三方发的,但我官方拥抱了它」。我第一次看到这段直接愣了三秒。倒不是说这有什么问题,只是……这种 AI 工具和 meme coin 的组合让我有一丝丝迷惑。当然这跟工具本身没关系,纯属聊斋。
内存占用不算小。Worker 服务加上 Chroma 跑起来,内存消耗比我预期的要多一点。如果你的机器配置一般,可能需要注意一下。
对比一下没有它之前
其实很多人会手动维护一个CLAUDE.md文件来给 Claude 提供项目上下文,这是标准做法。
但 claude-mem 的逻辑不一样——它捕获的是动态的、过程性的记忆,不是静态文档。你昨天调试了一个特定的 bug、尝试了三种方案、最后用了第二种——这些「过程」是不会手动写进 CLAUDE.md 的,但 claude-mem 会记住。
这种区别在长周期项目里特别明显。
最后随便说几句
这个项目有 69,800+ stars,6000+ forks,版本号已经到 v12.4.9 了(而且今天还在发版,这迭代频率是真的猛),说明社区是真的在用,真的在踩坑,真的在推进。
我个人的评价是:如果你是 Claude Code 的重度用户,特别是在跑长周期项目,这个插件装了不会后悔。它解决的是一个真实的痛点,而且解法在技术上是合理的。
如果你只是偶尔用用,可能感知不那么强,毕竟短 session 里「失忆」的代价还可以接受。
安装成本很低,npx claude-mem install就完事了,要卸载也方便。不如就试试?
反正我现在离不开了。就像离不开好用的 Bloomberg 终端一样——用习惯了,回不去。
对了如果你也在金融行业同时又在写代码,欢迎聊聊,感觉同类人不多但我们都挺折磨的 🤝