news 2026/6/10 14:31:56

超越 Grok,阶跃星辰拿下全球权威语音模型榜第一

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
超越 Grok,阶跃星辰拿下全球权威语音模型榜第一

1 月 15 日消息,全球知名权威大模型评测榜单 Artificial Analysis Speech Reasoning 更新,大模型创业公司阶跃星辰原生音频推理模型 Step-Audio-R1.1 登顶榜首,以 96.4% 准确率,超越 Grok、Gemini、GPT-Realtime 等主流一线模型,刷新历史最好成绩。目前,阶跃星辰已将这款模型开源,开发者可以下载体验。

据了解,该榜单是目前业界评估“原生语音模型”(Native Audio Models)最权威的第三方基准之一。核心考量模型直接处理音频并进行复杂逻辑推理的能力,主要考察维度包括准确率、首包延迟等。

根据榜单评测,在性能与速度的综合权衡上,Step-Audio-R1.1 全面碾压同类语音模型。

2025 年 11 月,阶跃星辰发布了全球首个开源原生音频推理模型 Step-Audio-R1,可以在不增加额外时延的情况下,端到端理解语音内容,并能够“像人类一样听到对话即可思考”。这次发布的 Step-Audio-R1.1 模型,是 Step-Audio-R1 的升级版,兼顾更强实时对话和复杂语音推理能力。完整的实时语音 API 将在 2 月上线,目前开放的chat模式已搭载 Step-Audio-R1.1 核心,支持边想边说的流式推理。

和大语言模型同理,语音模型同样需要具备强大推理能力,才能提供更高阶智能、更自然交互。基于推理能力,Step-Audio-R1.1 不仅能准确识别声音,还可以捕捉到声音背后的情绪和心理状态、言外之意,并能基于环境音推导对物理世界的理解。比如当听到最近爆火网络的“海豹舞”音频时,模型不仅能识别出韩语歌词,更判断出这是典型语言学习或发音练习的音频,而非自然对话。

一种行业共识是,语音是终端场景下最主流的交互方式。自 2025 年发力“AI+终端”战略,阶跃星辰相继发布了业内首个产品级的开源语音交互模型 Step-Audio、端到端语音模型 Step-Audio 2 系列、音频编辑模型 Step-Audio-EditX、全球首个开源原生音频推理模型 Step Audio R1。

在刚闭幕的 2026 年国际消费电子展上,吉利展示了搭载阶跃语音大模型的吉利银河 M9 海外版,凭借极具真人感的交互效果引发海外观众的热议。吉利银河 M9 也是业内首个搭载端到端语音模型的量产车型。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 12:31:34

磁盘罢工?教你一招让“无法访问”的数据起死回生!

在数字化时代,数据已成为我们生活和工作中不可或缺的一部分。然而,当遇到“磁盘位置不可用无法访问”的提示时,许多用户会感到手足无措,担心重要数据就此丢失。本文将深入解析这一问题的本质,并提供一套切实可行的数据…

作者头像 李华
网站建设 2026/6/10 10:49:28

教育考试系统怎样解决XHEDITOR公式粘贴的防作弊问题?

企业网站后台管理系统 - Word/公众号内容导入插件解决方案 一、系统架构设计 #mermaid-svg-NkEetKzwmoXn4u7N{font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}@keyframes edge-animation-frame{from{stroke-dashoffset:0;}}@keyfr…

作者头像 李华
网站建设 2026/6/10 11:02:14

省级荣誉加持!众智鸿图AI产品再获行业权威认可

近日,湖北省软件行业协会正式揭晓了第二批湖北省人工智能产品名单。继智巡终端(IV200)获授首批省级人工智能产品称号后,众智鸿图公司自主研发的另一款人工智能产品HopeMap AI平台(简称:HopeAI)&…

作者头像 李华
网站建设 2026/6/10 0:52:04

2小时,我搭了一套生产质检闭环系统,返工、漏检一次性解决

你有没有遇到过这种情况——机器轰隆隆转了一整天,产量报表看着漂亮,结果一到出货之后,客户一个电话打过来:“你们这质量怎么回事?” 然后整个车间开始翻箱倒柜找问题批次……最离谱的是,这种事不是第一次&…

作者头像 李华
网站建设 2026/6/10 12:32:22

大模型知识库(1)什么是Claude Skills?

Claude Skills 是 Anthropic 为其大语言模型 Claude 推出的扩展功能模块,可以理解为 Claude 的 “插件” 或 “技能包”,能够让 Claude 在基础对话能力之上,具备特定场景下的专业能力,从而更好地解决复杂任务。一、 Claude Skills…

作者头像 李华
网站建设 2026/6/10 12:28:15

学霸同款10个AI论文网站,继续教育学生轻松搞定毕业论文!

学霸同款10个AI论文网站,继续教育学生轻松搞定毕业论文! AI 工具助力论文写作,轻松应对学术挑战 在当今快节奏的学习生活中,继续教育学生面临着诸多挑战,尤其是在撰写毕业论文时。面对繁重的学业压力和复杂的学术要求&…

作者头像 李华