news 2026/4/16 9:22:00

智谱新模型也用DeepSeek的MLA,苹果M5就能跑

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
智谱新模型也用DeepSeek的MLA,苹果M5就能跑

这是一个30B总参数、仅3B激活参数的混合专家(MoE)架构模型,官方给它的定位是“本地编程与智能体助手”。

智谱AI上市后,再发新成果。

开源轻量级大语言模型GLM-4.7-Flash,直接替代前代GLM-4.5-Flash,API免费开放调用。

这是一个30B总参数、仅3B激活参数的混合专家(MoE)架构模型,官方给它的定位是“本地编程与智能体助手”。

在SWE-bench Verified代码修复测试中,GLM-4.7-Flash拿下59.2分,“人类最后的考试”等评测中也显著超越同规模的Qwen3-30B和GPT-OSS-20B。

作为去年12月发布的旗舰模型GLM-4.7的轻量化版本,GLM-4.7-Flash继承了GLM-4系列在编码和推理上的核心能力,同时针对效率做了专门优化。

除了编程,官方还推荐将这个模型用于创意写作、翻译、长上下文任务,甚至角色扮演场景。

30B参数只激活3B,MLA架构首次上线

GLM-4.7-Flash沿用了该系列的”混合思考模型”的设计。

总参数量300亿,但实际推理时仅激活约30亿参数,使模型在保持能力的同时大幅降低计算开销。

上下文窗口支持到200K,既可以云端API调用,也支持本地部署。

目前官方还没有给出技术报告,更多细节还要从配置文件自己挖掘。

有开发者注意到一个重要细节:GLM团队这次首次采用了MLA(Multi-head Latent Attention)架构。这一架构此前由DeepSeek-v2率先使用并验证有效,如今智谱也跟进了。

从具体结构来看,GLM-4.7-Flash的深度与GLM-4.5 Air和Qwen3-30B-A3B接近,但专家数量有所不同——它采用64个专家而非128个,激活时只调用5个(算上共享专家)。

目前发布不到12小时,HuggingFace、vLLM等主流平台就提供了day0支持。

官方也在第一时间提供了对华为昇腾NPU的支持。

本地部署方面,经开发者实测在32GB统一内存、M5芯片的苹果笔记本上能跑到43 token/s的速度。

官方API平台上基础版GLM-4.7-Flash完全免费(限1个并发),高速版GLM-4.7-FlashX价格也相当白菜。

对比同类模型,在上下文长度支持和输出token价格上有优势,但目前延迟和吞吐量还有待优化。

HuggingFace:https://huggingface.co/zai-org/GLM-4.7-Flash

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/6 2:52:41

Nature重磅!打破AI安全边界:微调代码为何会引发全面失准?

研究团队在OpenAI和阿里巴巴云模型上的实验揭示了一个令人不安的现象:如果你教一个大语言模型去写包含安全漏洞的代码,它学到的绝不仅仅是写代码。一项刚刚发表在《自然》杂志上的重磅新研究,发现了大模型安全的新幽灵:微小的恶意…

作者头像 李华
网站建设 2026/4/16 9:21:09

刚刚,GPT-5.2Pro独立证明45年未解的埃尔德什猜想!菲尔茨奖得主陶哲轩:其中存在陷阱,但AI没犯错

数学家保罗埃尔德什一生中提出了大量有趣的数学问题,有些是他自己完成的,有些是与合作者共同完成的。这些问题难度范围广泛,吸引了大量关注。如今,随着AI在数学推理能力上的提升,人们开始使用AI来解决未解决的埃尔德什…

作者头像 李华
网站建设 2026/4/14 6:53:16

GBase 8c数据库操作系统故障定位介绍

南大通用GBase 8c数据库查询状态时,显示一个节点上所有实例都不正常时,可能是操作系统发生了故障。可以通过如下方法确定操作系统是否存在问题:1、通过 SSH 或者其它远程登录工具登录该节点。如果连接失败,请尝试通过 ping 发包检…

作者头像 李华
网站建设 2026/4/15 8:26:40

TV电视影视大全:流畅观影背后的核心技术解析

各位影视与电视技术爱好者,今天分享TV电视影视大全的核心优势——聚焦画质优化与多端适配,技术点扎实易懂,适配智能电视、机顶盒、投影仪等终端,大幅提升全场景观影体验与实用性。 画质呈现上搭载双编码适配方案,主力…

作者头像 李华
网站建设 2026/4/10 17:06:25

A股恐惧与贪婪指数详解

A股恐惧与贪婪指数详解 指数分值 市场状态 投资含义 0 – 10 极度恐惧 恐慌抛售,绝佳买点 10 – 30 恐惧 风险积聚,警惕下行 30 – 70 中性 多空博弈,平稳运行 70 – 90 贪婪 追涨过热,考虑减仓 90 – 100 极度贪婪 见顶信号,随时调整 恐惧与贪婪指数

作者头像 李华
网站建设 2026/4/11 11:45:03

微信开发api文档

在微信生态深度渗透商业场景的背景下,基于WTAPI框架的微信个人号二次开发,通过开放接口、自然语言处理(NLP)、任务流程设计与安全隐私保护四大核心能力,可快速构建功能完备、交互智能、安全合规的微信机器人&#xff0…

作者头像 李华