news 2026/4/16 13:31:35

美团龙猫LongCat技术升级!新注意力机制解码速度快十倍,还能处理1M超长文本

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
美团龙猫LongCat技术升级!新注意力机制解码速度快十倍,还能处理1M超长文本

美团龙猫LongCat系列新年出招,发布全新稀疏注意力机制LoZA(LongCat ZigZag Attention)。

256K文本预加载提速超50%,还解锁了1M上下文窗口。

美团龙猫LongCat系列新年出招,发布全新稀疏注意力机制LoZA(LongCat ZigZag Attention)

新技术集中火力,重点解决长文本任务的理解、算力难题。

相比于LongCat系列之前的全注意力MLA机制,LoZA只改了一半的核心模块。

但模型长文本能力从256K扩展到1M,解码速度还快了不少。

甚至比同类型的Qwen-3模型表现还要好。

接下来看具体方案。

如何做到 “只算关键部分” ?

全注意力机制的算力瓶颈在于平方级的计算复杂度O (L²),这导致模型在处理长文本任务时对显卡要求高,还会出现推理延迟问题。

LoZA的核心思路是专注于处理重要的内容,不重要的部分少花力气。

作为LongCat系列的核心技术升级,LoZA主要是在原来的MLA机制上做改造。

具体分两步。

首先,给模型里的多头潜在注意力模块MLA做一个全局“筛查”,找出哪些模块可以被改造。

在原来的MLA架构中,每个MLA模块都是处理注意力的核心单元,现在的新方案是给每个模块配一个可学习权重α。

α值越高,说明该模块额全注意力计算越关键,一旦简化就容易丢性能;α值越低就意味着模块的可替代性强,即便换成更轻量的计算方式,对整体的理解能力影响也不大。

在训练过程中,团队冻结模型其他参数,只更新α的梯度,通过这种专门的校准训练让模型自主学习α值,然后按α值从小到大排序,找出那些稀疏化后不影响性能的MLA模块,也就是后续的优化目标。

随后,将找出的50%低性能模块换成更轻巧的流式稀疏注意力SSA

这样就形成了一种交错结构,团队将这种结构称为ZigZag

SSA的计算复杂度是线性的O (L·S)(S为稀疏窗口大小,固定为1024Token),远低于全注意力的O (L²)。

所以这种交错结构让模型既不会因为过度简化而变笨,又能把计算复杂度降到线性级别,省不少算力。

为了让模型在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个1024Token稀疏窗口

每个窗口里有1个负责抓整体关联的“全局块”和7个负责盯附近内容的“局部块”,单块大小为128Token。

这样的改造也不需要从头训练,在中期训练阶段就能完成,成本也比较低。

从测试数据来看,LoZA的表现也不错,主要是“更快”的同时“没变笨”

速度上,要是处理128K上下文,解码速度直接比原来快10倍;

256K上下文,模型预加载(读文本过程)速度快了50%,后续解码阶段生成内容时还能省30%的算力,相当于同样的硬件,现在能同时处理两倍多的长文本任务。

这也让LongCat-Flash-Exp解锁了1M上下文窗口。

性能上,LoZA也没因为简化而缩水。

处理回答问题、写代码这类日常任务时,和原版LongCat-Flash持平;处理长文本任务时,表现反而更好。

比如在MRCR测试里,反超了同样能处理1M长文本的Qwen-3模型,还更稳定。

接下来,团队还计划让LoZA支持动态稀疏比例

短文本场景自动多用全注意力保证精度,长文本场景自动增加稀疏模块提升效率,甚至适配多模态模型处理长视频、长图文内容。

好一个新年新气象!

如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!​

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

四、AI大模型商业化落地方案

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/11 6:49:08

3D应用丨光子精密解锁多个高难度3D相机拼接检测

在高端制造与精密检测领域,面对尺寸庞大、结构复杂或要求全尺寸测量的工件,3D线激光轮廓测量仪的拼接检测技术已成为不可或缺的解决方案。然而,稳定可靠的拼接检测绝非简单叠加 3D 相机就能实现。在真实工业场景中的应用,常具体化…

作者头像 李华
网站建设 2026/4/13 23:44:20

人工智能+时代:高校人才培养的新征程

在当今科技飞速发展的时代,“人工智能 ”的热潮正席卷而来。各种与人工智能 相关的政策如雨后春笋般不断涌现。从“人工智能 医疗”助力疾病诊断与治疗,到“人工智能 教育”开启智慧教学新模式,再到“人工智能 金融”为金融行业带来高效风…

作者头像 李华
网站建设 2026/4/15 16:06:48

别只盯酷炫形态,CES 2026逛展,我更关注AI硬件的落地底气

刚从CES 2026展会上归来,仍觉余韵未消、震撼不已!今年拉斯维加斯这场展会,堪称AI硬件领域的巅峰对决。服务机器人能精准听令调酒,智能座舱靠眼动追踪交互,AR眼镜轻巧却功能强大……各类展品共同描绘出智能无缝的未来生…

作者头像 李华
网站建设 2026/4/8 18:49:09

黑客网站大全!都在这了!速看被删就没了

黑客网站大全!都在这了!速看被删就没了 我们学习网络安全,很多学习路线都有提到多逛论坛,阅读他人的技术分析帖,学习其挖洞思路和技巧。但是往往对于初学者来说,不知道去哪里寻找技术分析帖,也…

作者头像 李华
网站建设 2026/4/14 9:32:00

小白考CPA难吗?难度、通过率科目指南

对于零基础小白来说,CPA(注册会计师)考试常被贴上“难度大”“通过率低”的标签,但真正的关键在于是否找对了备考路径。考伯乐依托多年财经教育沉淀,专为小白打造从入门到持证的高效方案,今天就从难度、通过…

作者头像 李华
网站建设 2026/4/10 21:24:35

【开题答辩全过程】以 基于安卓的医疗健康查询系统为例,包含答辩的问题和答案

个人简介一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。感谢大家的…

作者头像 李华