news 2026/4/25 16:32:57

DeepSeek-V4 来了:1.6T 参数、百万上下文、全新注意力机制

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
DeepSeek-V4 来了:1.6T 参数、百万上下文、全新注意力机制

等了大半年,春节没等到,清明没等到,结果人家挑了个普通周五的上午,悄没声儿地把 DeepSeek-V4 放出来了。

没有预热直播,没有 roadmap 大饼,甚至发布前都没回应过外界"是不是跳票了""是不是被 Claude 蒸馏搞定了"的传言。就四个字:率道而行。

两个版本,一个顶配一个走量

V4 这次一口气上了两个型号:

Pro 对标的是闭源顶级,Flash 主打性价比——同样的百万上下文,更小的参数量,调用价格更便宜。

有意思的是,两个版本都同时支持非思考模式思考模式,思考模式下还能用reasoning_effort调强度,分 high 和 max 两档。官方原话:复杂 Agent 场景,直接上 max。

模型调用与参数调整方法请参考 API 文档:

https://api-docs.deepseek.com/zh-cn/guides/thinking_mode


性能到底怎么样?

官方给了三条核心判断:

Agent 能力大幅提升。Agentic Coding 评测中,V4-Pro 已经是当前开源最强。内部测评说得更直白——员工写代码的体验已经优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式。当然,跟 Opus 4.6 开思考比还是有差距,人家也没吹过头。

更关键的是,V4 已经成了 DeepSeek 内部员工日常用的 Agentic Coding 模型,Claude 在公司内部已经被换掉了。

世界知识储备拉满。测评里大幅领先其他开源模型,只比 Gemini-Pro-3.1 稍弱一点。

推理性能世界第一梯队。数学、STEM、竞赛级代码,V4-Pro 超过所有已公开评测的开源模型,比肩顶级闭源。

Flash 版本在简单 Agent 任务上跟 Pro 差不多,但高难度任务还是有差距。有意思的是,在"绝望的父亲"这个经典红绿色盲遗传学推理场景里,V4 也没能一轮就抓到关键点——看来再强的模型,有时候也会漏掉常识。


百万上下文,从"王牌"变成了"水电煤"

一年前,100 万上下文还是 Gemini 独家的杀手锏,其他闭源模型最多 128K 或 200K,开源这边几乎没人碰得起这个量级。

现在 DeepSeek 直接把百万上下文变成了标配,所有官方服务默认支持,而且开源。

怎么做到的?发布稿里写了答案——

V4 搞了一套全新的注意力机制,在 token 维度做压缩,再结合 DSA 稀疏注意力一起用。结果就是计算量和显存需求大幅降低。具体来说,跟 V3 比,推理 FLOPs 降了 73%,KV 缓存减少了 90%。

回头看半年前的 V3.2-Exp,当时引入了 DSA 但跑分跟 V3.1-Terminus 差不多,大家觉得就是个中间过渡版本。现在才明白,那是在给 V4 打地基。


Agent 专项优化

V4 对 Claude Code、OpenClaw、OpenCode、CodeBuddy 这些主流 Agent 产品做了适配优化,代码任务和文档生成任务都有明显提升。发布稿甚至还附了一张 V4-Pro 在某个 Agent 框架下自动生成的 PPT 内页。


API 怎么用?

两个版本同步上线,支持 OpenAI ChatCompletions 接口和 Anthropic 接口两套。

用法很简单:

  • base_url不变

  • model参数改成deepseek-v4-prodeepseek-v4-flash

不过有个重要提醒:旧模型名要下架了deepseek-chatdeepseek-reasoner会在三个月后(2026 年 7 月 24 日)停用。目前这两个名字分别指向 V4-Flash 的非思考和思考模式。个人开发者改个参数就行,但对接了生产环境的公司,这三个月内得完成迁移。


国产算力,尘埃落定

大家一直关心的"到底用没用国产芯片",答案来了——下半年批量上华为算力。

昇腾 CANN 已经安排直播首发 DeepSeek-V4 在昇腾平台的运行。寒武纪那边也完成了 vLLM 推理框架对两个版本的 Day 0 适配,代码直接开源到 GitHub。

从训练到推理,国产算力的拼图正在收紧。


一句话总结发布

发布稿最后,DeepSeek 引了荀子《非十二子》里的一句话:

「不诱于誉,不恐于诽,率道而行,端然正己。」

不被赞誉诱惑,不被非议吓退,按自己的路走,做好自己的事。

这话放在今天特别应景——半年多的传言、猜测、催更,他们一句话没回。然后在一个周五上午,开源链接、技术报告、官网更新、App 上线、API 同步,一次性全给了。

不讲故事,只给东西。


资源汇总

  • 开源地址:https://huggingface.co/collections/deepseek-ai/deepseek-v4

  • 魔搭镜像:https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

  • 技术报告:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf


你觉得 V4 这次够不够格叫"开源新王"?评论区聊聊 👇

🎯 往期推荐👇

  • AI Coding 全景调研:从补全到Agent,IDE、CLI、Agent、编程大模型30+工具3万字深度调研

  • AI Coding 安全解决方案

  • Karpathy 提出的 LLM Wiki:让知识真正复利增长的革命性方法

  • 从 Harness Engineering 到 Hermes Agent 说的是什么,与OpenClaw相比有什么不同?

  • Harness Engineering:为什么模型不变性能却能提升 10 倍?

  • 政企版 OpenClaw 安全落地指南:让 AI 智能体"看得清、管得住、用得好"

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/25 16:25:15

腾讯云TAT Agent:Rust构建的云服务器自动化运维代理详解

1. 项目概述:从零认识TAT Agent如果你是一名云服务器运维工程师,或者正在管理着腾讯云上的CVM、轻量应用服务器,那么你一定遇到过这样的场景:需要给几十上百台机器批量执行一个脚本、统一安装一个补丁,或者只是简单地查…

作者头像 李华
网站建设 2026/4/25 16:25:03

英语启蒙的困境与突破:为什么越来越多家长选择雷小喵

"鸡飞狗跳"的英语课堂,正在全国上演每个傍晚,无数家庭都在上演同样的一幕:客厅里充满了紧张的气氛。"宝贝,把这些单词再读一遍。"家长耐心地说。孩子的反应往往是 "嗯……" 一声,然后开…

作者头像 李华
网站建设 2026/4/25 16:23:46

数字PID温度控制器设计与实现详解

1. 数字PID温度控制器实现概述在工业自动化和精密温控领域,PID控制器一直是核心控制算法。我最近基于PSoC微控制器完成了一个数字PID温度控制器的完整实现,支持热电偶和RTD两种传感器,以及相位控制和数字脉冲控制两种功率调节方式。这个项目让…

作者头像 李华
网站建设 2026/4/25 16:22:46

开源SENAITE LIMS:如何构建实验室数字化转型的完整解决方案?

开源SENAITE LIMS:如何构建实验室数字化转型的完整解决方案? 【免费下载链接】senaite.lims SENAITE Meta Package 项目地址: https://gitcode.com/gh_mirrors/se/senaite.lims 在当今数字化转型浪潮中,实验室信息管理系统(LIMS)已成为…

作者头像 李华