news 2026/4/26 2:28:47

DeepSeek-V4 预览版开源上线!100 万上下文长度时代来袭,性能媲美顶级闭源模型

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
DeepSeek-V4 预览版开源上线!100 万上下文长度时代来袭,性能媲美顶级闭源模型

DeepSeek API 文档导航

提供了 DeepSeek API 文档的访问入口,有语言选择,包括 English 和中文(中国)。还给出了 DeepSeek 平台的链接,以及平台下的快速开始、API 指南、API 参考、新闻、其他资源、常见问题解答、更新日志等板块。

新闻:DeepSeek-V4 预览版发布

DeepSeek-V4 预览版正式上线并开源,欢迎进入经济高效的 100 万上下文长度时代。有 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 两个版本。

DeepSeek-V4-Pro 特点

总参数 1.6T / 活跃参数 49B,性能可与全球顶级闭源模型相媲美。具有增强的智能体能力,在智能体编码基准测试中达到开源最优水平;有丰富的世界知识,领先于当前所有开源模型,仅次于 Gemini-3.1-Pro;拥有世界级推理能力,在数学/STEM/编码方面超越当前所有开源模型,可与顶级闭源模型相抗衡。

DeepSeek-V4-Flash 特点

总参数 284B / 活跃参数 13B,是快速、高效且经济的选择。推理能力与 V4-Pro 十分接近,在简单智能体任务上表现与 V4-Pro 相当,参数规模更小,响应速度更快,API 定价极具成本效益。

结构创新与超高上下文效率

采用新型注意力机制,逐 Token 压缩 + DSA(DeepSeek 稀疏注意力)。具有全球领先的长上下文处理能力,大幅降低计算和内存成本。所有 DeepSeek 官方服务默认支持 100 万上下文长度。

针对智能体能力的专项优化

DeepSeek-V4 与 Claude Code、OpenClaw 和 OpenCode 等领先的 AI 智能体实现了无缝集成,已在 DeepSeek 内部推动智能体编码工作。

API 即日起可用

保持 base_url 不变,只需将模型更新为 deepseek-v4-pro 或 deepseek-v4-flash。支持 OpenAI ChatCompletions 和 Anthropic API。两个模型都支持 100 万上下文长度和双模式(思维/非思维)。注意,deepseek-chat 和 deepseek-reasoner 将在 2026 年 7 月 24 日 15:59(UTC 时间)后完全停用,无法访问(目前路由到 deepseek-v4-flash 的非思维/思维模式)。

相关内容

包括 DeepSeek-V4-Pro、DeepSeek-V4-Flash、结构创新与超高上下文效率、针对智能体能力的专项优化、API 即日起可用等方面。

官方渠道

微信公众号有对应的二维码,社区提供了邮箱、Discord、Twitter 等渠道,更多信息可在 GitHub 查看。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/26 2:25:59

Julep框架:简化AI Agent开发与编排的开源解决方案

1. 项目概述与核心价值最近在AI应用开发领域,一个名为Julep的开源项目引起了我的注意。简单来说,Julep是一个旨在简化AI Agent(智能体)构建与编排的开发框架。如果你曾经尝试过基于大语言模型(LLM)来构建一…

作者头像 李华
网站建设 2026/4/26 2:19:20

数字孪生遇上AI:电磁仿真的“智能革命”全解析

数字孪生遇上AI:电磁仿真的“智能革命”全解析当虚拟世界不仅能“镜像”现实,更能“思考”和“创造”,一场由AI驱动的电磁仿真范式革命已然到来。引言:当虚拟映射获得“智慧大脑” 在构建高保真数字孪生体的宏大工程中&#xff0c…

作者头像 李华
网站建设 2026/4/26 2:18:19

Parlant:构建可控AI对话智能体的上下文工程与动态匹配框架

1. 项目概述:为什么我们需要一个对话控制层?如果你正在构建面向真实客户的AI智能体,无论是客服、销售还是顾问,你大概率已经踩过这两个坑:要么是系统提示词(System Prompt)越来越长,…

作者头像 李华