Qwen3-30B-A3B-Thinking-2507发布：33亿激活参数实现数学竞赛级推理能力-编程阁

Qwen3-30B-A3B-Thinking-2507发布：33亿激活参数实现数学竞赛级推理能力

【免费下载链接】Qwen3-30B-A3B-Thinking-2507-FP8项目地址: https://ai.gitcode.com/hf_mirrors/Qwen/Qwen3-30B-A3B-Thinking-2507-FP8

导语

阿里通义千问团队推出Qwen3-30B-A3B-Thinking-2507模型，以305亿总参数、33亿激活参数的MoE架构，在AIME数学竞赛中斩获85.0分，代码测试LiveCodeBench v6达66.0分，重新定义中等规模大模型性能边界。

行业现状：推理需求倒逼模型架构革新

2025年大语言模型竞争已从参数规模转向推理效率。根据量子位智库报告，企业级应用中90%的金融法律机构将"长文本理解准确率"列为核心指标，而现有模型普遍面临分块处理导致30%信息丢失的痛点。此时Qwen3-30B-A3B-Thinking-2507的推出恰逢其时——通过创新的混合专家（MoE）架构，仅激活8/128专家即可实现旗舰级性能，推理成本降低40%。

核心亮点：三大突破重新定义行业标准

1. 数学推理能力跃居全球榜首

在国际数学竞赛AIME25评测中，该模型以85.0分超越Gemini2.5-Flash-Thinking 13分，HMMT竞赛71.4分的成绩领先第二名8.9分。这种能力使模型可直接处理金融衍生品定价、工程优化等需要深度数学建模的场景。

2. 26万token超长上下文处理

通过Dual Chunk Attention技术，实现262,144 tokens原生支持，扩展配置可处理100万token（约2000页A4文本）。在RULER基准测试中，100万token长度下信息保留率达79.6%，远超行业平均65%水平。

3. FP8量化实现高效部署

提供的FP8量化版本在保持性能的同时，将显存占用减少50%。配合vLLM推理框架，在8×A100配置下可实现每秒230 tokens生成速度，满足实时交互需求。

性能对比：小参数实现大能力

评测维度	Gemini2.5-Flash	Qwen3-235B旗舰版	本模型	提升幅度
AIME数学竞赛	72.0	81.5	85.0	+4.3%
LiveCodeBench代码	61.2	55.7	66.0	+18.5%
MMLU-Pro知识	81.9	82.8	80.9	-2.3%
WritingBench写作	83.9	80.3	85.0	+5.9%

数据来源：阿里通义千问官方测试报告（2025年7月）

行业影响：开启专业领域AI应用新纪元

法律金融场景革命

某头部律所测试显示，该模型可一次性处理500份标准合同（约50万token），关键条款定位准确率达94.7%，效率较传统分块方法提升8倍。在金融领域，能实时分析10GB衍生品合同并生成风险评估报告。

科研协作新范式

清华大学NLP实验室验证，模型可同时处理50篇相关论文（约80万token），自动生成综述的信息覆盖率达91%，将文献调研时间从周级压缩至小时级。

开发部署简易化

模型已在Hugging Face和ModelScope开源，支持SGLang、vLLM等主流框架。通过Ollama可实现本地部署，普通开发者只需3步即可启动服务：

# 克隆仓库 git clone https://gitcode.com/hf_mirrors/Qwen/Qwen3-30B-A3B-Thinking-2507-FP8 # 安装依赖 cd Qwen3-30B-A3B-Thinking-2507-FP8 pip install -r requirements.txt # 启动vLLM服务 vllm serve . --model Qwen3-30B-A3B-Thinking-2507-FP8 --max-model-len 262144 --enable-reasoning

未来展望：推理即服务成新基建

随着Qwen3-30B-A3B-Thinking-2507的普及，行业正加速从"通用大模型"向"专用推理引擎"转型。通义千问团队透露，下一代模型将重点强化多模态推理能力，计划支持CAD图纸、医学影像等专业数据解析。对于企业而言，现在正是布局推理型AI应用的关键窗口期——既能降低算力成本，又可抢占垂直领域先机。

本文所述模型及代码已开源，项目地址：https://gitcode.com/hf_mirrors/Qwen/Qwen3-30B-A3B-Thinking-2507-FP8

如上图所示，Qwen3模型采用创新的混合专家架构，通过128个专家中动态激活8个的方式，实现"大参数+小激活"的高效推理。这种设计使30B模型达到200B+量级性能，为行业树立了效率新标杆。

该图表展示了各模型在AIME数学竞赛中的得分情况，Qwen3-30B-A3B-Thinking-2507以85.0分超越所有竞品，尤其在几何证明和微积分应用题型中表现突出，体现了其深度推理能力。

此图展示了模型处理100万token长文本的实时进度条，79.6%的信息保留率意味着律师可一次性上传整卷案卷，医生能输入完整病程记录，极大提升专业领域工作效率。

【免费下载链接】Qwen3-30B-A3B-Thinking-2507-FP8项目地址: https://ai.gitcode.com/hf_mirrors/Qwen/Qwen3-30B-A3B-Thinking-2507-FP8

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

next-ai-draw-io,把「对话式 AI」塞进 draw.io 的生产力工具

next-ai-draw-io 是一个基于 Next.js 的 Web 应用，把大模型能力与 draw.io（diagrams.net）的“可编辑图表画布”深度融合：你不再需要从空白画布慢慢拖拽组件，而是可以像聊天一样用自然语言让 AI 创建、修改、优化各类图表（流程图、架构图、思维导图、草图等），然后你还…

李华

手绘风格UI革命：wired-elements组件库完整开发实战

手绘风格UI革命：wired-elements组件库完整开发实战【免费下载链接】wired-elements 项目地址: https://gitcode.com/gh_mirrors/wir/wired-elements 想要为你的Web项目注入独特的手绘艺术感吗？wired-elements正是你需要的创意UI解决方案&#x…

李华

终极免费DRM视频解密工具：轻松保存加密流媒体内容

还在为无法下载喜爱的流媒体视频而烦恼吗？Video Decrypter 是一款专业的视频解密工具，专门针对MPEG-DASH Widevine DRM加密视频进行解密和下载。无论您是想要保存珍贵的视频内容，还是需要进行流媒体下载，这款开源神器都能帮您轻松…

李华

终极指南：从零构建智能机器狗 - openDogV2开源项目完整教程

终极指南：从零构建智能机器狗 - openDogV2开源项目完整教程【免费下载链接】openDogV2 项目地址: https://gitcode.com/gh_mirrors/op/openDogV2 openDogV2是一个革命性的开源智能机器狗开发平台，为机器人爱好者和研究者提供了完整的DIY机器人解…

李华

5天零基础搭建：开源协作机械臂完整实战指南

还在为工业机械臂动辄数万元的价格望而却步吗？🤔 现在你只需花费不到2000元，就能亲手打造一台功能完整的开源协作机械臂！本指南将带你从零件准备到智能控制，5天内完成从零到一的完整搭建过程。🎯 【免费下载…

李华

BetterNCM插件管理器终极配置指南：3步快速上手网易云音乐插件生态

BetterNCM插件管理器终极配置指南：3步快速上手网易云音乐插件生态【免费下载链接】BetterNCM-Installer 一键安装 Better 系软件项目地址: https://gitcode.com/gh_mirrors/be/BetterNCM-Installer BetterNCM插件管理器是专为PC版网易云音乐客户端设计的强…

李华