DeepSeek-V4 来了：1.6T 参数、百万上下文、全新注意力机制-编程阁

等了大半年，春节没等到，清明没等到，结果人家挑了个普通周五的上午，悄没声儿地把 DeepSeek-V4 放出来了。

没有预热直播，没有 roadmap 大饼，甚至发布前都没回应过外界"是不是跳票了""是不是被 Claude 蒸馏搞定了"的传言。就四个字：率道而行。

两个版本，一个顶配一个走量

V4 这次一口气上了两个型号：

Pro 对标的是闭源顶级，Flash 主打性价比——同样的百万上下文，更小的参数量，调用价格更便宜。

有意思的是，两个版本都同时支持非思考模式和思考模式，思考模式下还能用reasoning_effort调强度，分 high 和 max 两档。官方原话：复杂 Agent 场景，直接上 max。

模型调用与参数调整方法请参考 API 文档：

https://api-docs.deepseek.com/zh-cn/guides/thinking_mode

性能到底怎么样？

官方给了三条核心判断：

Agent 能力大幅提升。Agentic Coding 评测中，V4-Pro 已经是当前开源最强。内部测评说得更直白——员工写代码的体验已经优于 Sonnet 4.5，交付质量接近 Opus 4.6 非思考模式。当然，跟 Opus 4.6 开思考比还是有差距，人家也没吹过头。

更关键的是，V4 已经成了 DeepSeek 内部员工日常用的 Agentic Coding 模型，Claude 在公司内部已经被换掉了。

世界知识储备拉满。测评里大幅领先其他开源模型，只比 Gemini-Pro-3.1 稍弱一点。

推理性能世界第一梯队。数学、STEM、竞赛级代码，V4-Pro 超过所有已公开评测的开源模型，比肩顶级闭源。

Flash 版本在简单 Agent 任务上跟 Pro 差不多，但高难度任务还是有差距。有意思的是，在"绝望的父亲"这个经典红绿色盲遗传学推理场景里，V4 也没能一轮就抓到关键点——看来再强的模型，有时候也会漏掉常识。

百万上下文，从"王牌"变成了"水电煤"

一年前，100 万上下文还是 Gemini 独家的杀手锏，其他闭源模型最多 128K 或 200K，开源这边几乎没人碰得起这个量级。

现在 DeepSeek 直接把百万上下文变成了标配，所有官方服务默认支持，而且开源。

怎么做到的？发布稿里写了答案——

V4 搞了一套全新的注意力机制，在 token 维度做压缩，再结合 DSA 稀疏注意力一起用。结果就是计算量和显存需求大幅降低。具体来说，跟 V3 比，推理 FLOPs 降了 73%，KV 缓存减少了 90%。

回头看半年前的 V3.2-Exp，当时引入了 DSA 但跑分跟 V3.1-Terminus 差不多，大家觉得就是个中间过渡版本。现在才明白，那是在给 V4 打地基。

Agent 专项优化

V4 对 Claude Code、OpenClaw、OpenCode、CodeBuddy 这些主流 Agent 产品做了适配优化，代码任务和文档生成任务都有明显提升。发布稿甚至还附了一张 V4-Pro 在某个 Agent 框架下自动生成的 PPT 内页。

API 怎么用？

两个版本同步上线，支持 OpenAI ChatCompletions 接口和 Anthropic 接口两套。

用法很简单：

base_url不变
model参数改成deepseek-v4-pro或deepseek-v4-flash

不过有个重要提醒：旧模型名要下架了。deepseek-chat和deepseek-reasoner会在三个月后（2026 年 7 月 24 日）停用。目前这两个名字分别指向 V4-Flash 的非思考和思考模式。个人开发者改个参数就行，但对接了生产环境的公司，这三个月内得完成迁移。

国产算力，尘埃落定

大家一直关心的"到底用没用国产芯片"，答案来了——下半年批量上华为算力。

昇腾 CANN 已经安排直播首发 DeepSeek-V4 在昇腾平台的运行。寒武纪那边也完成了 vLLM 推理框架对两个版本的 Day 0 适配，代码直接开源到 GitHub。

从训练到推理，国产算力的拼图正在收紧。

一句话总结发布

发布稿最后，DeepSeek 引了荀子《非十二子》里的一句话：

「不诱于誉，不恐于诽，率道而行，端然正己。」

不被赞誉诱惑，不被非议吓退，按自己的路走，做好自己的事。

这话放在今天特别应景——半年多的传言、猜测、催更，他们一句话没回。然后在一个周五上午，开源链接、技术报告、官网更新、App 上线、API 同步，一次性全给了。

不讲故事，只给东西。

资源汇总

开源地址：https://huggingface.co/collections/deepseek-ai/deepseek-v4
魔搭镜像：https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4
技术报告：https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

你觉得 V4 这次够不够格叫"开源新王"？评论区聊聊 👇

🎯 往期推荐👇

AI Coding 全景调研：从补全到Agent，IDE、CLI、Agent、编程大模型30+工具3万字深度调研
AI Coding 安全解决方案
Karpathy 提出的 LLM Wiki：让知识真正复利增长的革命性方法
从 Harness Engineering 到 Hermes Agent 说的是什么，与OpenClaw相比有什么不同？
Harness Engineering：为什么模型不变性能却能提升 10 倍？
政企版 OpenClaw 安全落地指南：让 AI 智能体"看得清、管得住、用得好"

DeepSeek-V4 来了：1.6T 参数、百万上下文、全新注意力机制

两个版本，一个顶配一个走量

性能到底怎么样？

百万上下文，从"王牌"变成了"水电煤"

Agent 专项优化

API 怎么用？

国产算力，尘埃落定

一句话总结发布

资源汇总

agent-browser总是启动失败？DevToolsActivePort ？深入排查解决错误的完整指南

腾讯云TAT Agent：Rust构建的云服务器自动化运维代理详解

英语启蒙的困境与突破：为什么越来越多家长选择雷小喵

数字PID温度控制器设计与实现详解

开源SENAITE LIMS：如何构建实验室数字化转型的完整解决方案？

2026年AI会议录音总结工具全场景大横评，真香体验比拼后差距竟然这么大