news 2026/5/8 21:09:12

claude省钱方式-怎么花更少的tokens获得更好的体验?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
claude省钱方式-怎么花更少的tokens获得更好的体验?

文章目录

      • 1.首先,怎么知道自己的tokens都花在什么地方了?
        • 让我们简单操作下,看下执行依据 hello要花费多少:
      • 2.但是在其他的场合中,要怎么避免tokens消耗过快呢?
        • 2.1 /clear
        • 2.2 /compact
        • 2.3 settiong.json文件设置
        • 2.4 专项专立

​ 使用大模型怎么用更少的tokens办好事??

1.首先,怎么知道自己的tokens都花在什么地方了?

我们先/clear下,清空上下文信息,然后输入/context查看什么都不干的情况下,大模型需要多少的tokens:

好了,这下我们就能知道,哪怕什么都不用,我们其实就会花费

2.4k+15.5k+1.2k + 286 = 19.3k tokens!

让我们简单操作下,看下执行依据 hello要花费多少:

5.3k+15.5k+1.2k = 24.4k tokens!

这下我们知道,真正打个招呼其实用了 5.3 - 2.4 = 2.9K tokensl.

那么你可能就会有疑问了,这里最占大头的systems tools是什么?为什么它要15.5k??

2.但是在其他的场合中,要怎么避免tokens消耗过快呢?

2.1 /clear

这是最有效的指令,直接一键清空上下文,当然(它和重新打开一个claude界面是一样的效果)。

为什么呢?

假设第一次提问,你发给claude:苹果是红色的吗? claude回复:11k tokens 第二次提问,你发给claude: 特朗普打伊朗的原因?

好,那么此刻,claude会做什么呢?

claude会将苹果是红色的吗? + 第一次提问回复的11k tokens + 特朗普打伊朗的原因?全部打包重新发到官网!即传给大模型的input tokens 会瞬间暴涨到11k+ tokens!!那么这样来回10次,哪怕是个简单的问题,也会直接耗尽100w tokens!

这下知道为什么claude的tokens消耗越来越快了吧!

2.2 /compact

假设,你现在两次发给claude的问题本就是上下文相关的,比如第一个问题要求完成功能1.1 第二个问题要求完成功能1.2,而功能1.1和1.2是强相关的,这下子,/clear就不合适了。

可以执行 /compact,这样大模型就会自动去提炼,将长长的上下文进行压缩了。/compact执行完会清爽很多!

2.3 settiong.json文件设置

在settions.json (Linux环境下是 ~/.claude/settions.json,windows对应的是 C:/users/用户名/.claude/settings.json)进行设置:

添加以下两行:

“CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC”: “1”, ## 关闭不必要通信,类似浏览器cookies
“MAX_CONSECUTIVE_AUTOCOMPACT_FAILURES” : “3” # 连续3次失败就停止尝试

{ "autoUpdatesChannel": "latest", "enabledPlugins": { "claude-md-management@claude-plugins-official": true, "code-simplifier@claude-plugins-official": true, "commit-commands@claude-plugins-official": true, "superpowers@claude-plugins-official": true }, "env": { "ANTHROPIC_AUTH_TOKEN": "{你的API KEY}", "ANTHROPIC_BASE_URL": "http://8.145.56.52:80", "ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-5", "ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5", "ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5", "ANTHROPIC_MODEL": "glm-5.1", "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1" ## 关闭不必要通信,类似浏览器cookies }, "MAX_CONSECUTIVE_AUTOCOMPACT_FAILURES" : "3" # 连续3次失败就停止尝试, "model": "opus[1m]" }
2.4 专项专立

对于不同的project,在不同的project维护各自的CLAUDE.md文件、.claude文件夹。

创建CLAUDE.md文件是为了让claude每次进入这个项目都能快速地理解整个项目,而不是每次都花费大量的tokens去重新读取整个项目。

而创建不同的.claude文件夹则是在不同的project下可以配置不同的skills、mcp。想想,为什么project1要去额外加载project2中需要的技巧呢?假设它们是公用的,那为什么不放到总的环境设置中进行维护?

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 9:47:43

C语言单片机GPIO寄存器位操作详解

1. 项目概述在嵌入式开发中,位操作是最基础也是最核心的技能之一。今天我们就来深入探讨如何用C语言对单片机寄存器进行位操作,特别是GPIO控制寄存器的置位和清零操作。这个看似简单的操作,在实际项目中却经常成为新手程序员的"绊脚石&q…

作者头像 李华
网站建设 2026/4/15 23:54:30

2026年翟章锁甲状腺调理新见解:比错不错的选择

翟章锁:甲状腺健康调理的坚守者在中医领域,有这样一位老中医,他不仅有着丰富的临床经验,还以独特的诊疗理念赢得了众多患者的信任。他就是翟章锁,1956年出生于河北保定,自幼受祖辈影响接触中医,…

作者头像 李华
网站建设 2026/4/15 14:06:23

500行代码还原儿时经典 Python Pygame 制作带 AI 决策的飞行棋

1. 前言 飞行棋(Aeroplane Chess)是许多人童年的回忆。今天,我们将使用 Python 的 Pygame 库,从零开始构建一个完整的飞行棋游戏。 这不仅仅是一个简单的绘图程序,它包含了完整的游戏逻辑状态机、一维路径坐标映射&am…

作者头像 李华
网站建设 2026/4/17 10:21:28

创建abb机器人机械装置————简易活塞

步骤 1:新建并保存工作站打开 RobotStudio,新建空工作站点击「文件」→「保存工作站为」,命名为5-4 example,保存为.rsstn 格式步骤 2:创建活塞主体(圆柱体)切换到建模选项卡点击「固体」→「圆…

作者头像 李华
网站建设 2026/4/17 19:32:12

2026 年 4 月 GEO 优化服务商 TOP5:行业头部品牌实力全景展现

2026 年,生成式 AI 彻底重塑信息分发与用户获取信息的核心逻辑,品牌在 AI 生态中的曝光度、呈现质感与可信背书,直接决定市场声量与商业转化效率。GEO(生成式引擎优化)作为企业链接 AI 生态与终端用户的关键通路&#…

作者头像 李华
网站建设 2026/4/14 6:57:18

RNN与LSTM

RNN 是什么你可以把 RNN 理解成:一种专门处理“序列”的神经网络,它会把前面时刻的信息带到后面时刻。这里的“序列”可以是:一个句子的词序列一段语音序列一个时间序列一串股票价格一段视频帧序列在语言里,序列就是:我…

作者头像 李华