news 2026/6/9 18:39:44

大语言模型综合排行榜 26-02-01图片本周排名前10的模型为:Gemini 3 ProGPT-5.2Gemini 3 FlashClaude Opus 4.5GPT

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大语言模型综合排行榜 26-02-01图片本周排名前10的模型为:Gemini 3 ProGPT-5.2Gemini 3 FlashClaude Opus 4.5GPT

大语言模型综合排行榜 26-02-01

原创 网球玩的人 老网的博客2026年2月1日 16:25加拿大

本周排名前10的模型为:

Gemini 3 Pro

GPT-5.2

Gemini 3 Flash

Claude Opus 4.5

GPT-5.1

Kimi-K2.5

GPT-5

DeepSeek v3.2

GLM-4.7

GPT-5.1 Mini

简介:

本表格汇总了常用大语言模型在主流评测排行榜上的表现。评测范围涵盖:

人类偏好(文字和视觉),知识与推理,数学能力,代码能力,长文本推理,和指令遵循能力。

在整合各项评测结果的基础上,计算出综合排名。

更新:

本次排名,Kimi-K2.5模型首次加入榜单。它没有特别出彩的表现,但综合实力均衡,且比Kimi-K2有明显提升,跻身第六。

artifical analysis边的数据更新了Qwen 3 max的推理模型的结果。比起非推理模型,整体能力大幅提升。

除了gpt-4.5,本榜单所有模型皆为推理模型。推理能力基本上是顶尖模型的标配了。

总结:

综合实力最强:Gemini 3 Pro

国内最强模型:Kimi-K2.5/DeepSeek v3.2/GLM-4.7

最强开源模型:Kimi-K2.5/DeepSeek v3.2/GLM-4.7

最强代码模型:Gemini 3 Pro/GPT-5.2/Claude Opus 4.5

本项目仓库:

https://github.com/Tennisatw/LLM-Leaderboard

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 0:33:09

跨风格迁移案例:用InstructPix2Pix将照片转为水彩/油画风效果

跨风格迁移案例:用InstructPix2Pix将照片转为水彩/油画风效果 1. 为什么说InstructPix2Pix是“听得懂人话”的修图师? 你有没有试过在修图软件里折腾半天,只为把一张普通照片变成水彩画?调色、加纹理、模糊边缘、反复蒙版……最…

作者头像 李华
网站建设 2026/6/10 13:37:13

GPEN开源模型部署:适配Jetson AGX Orin的边缘端人脸增强方案

GPEN开源模型部署:适配Jetson AGX Orin的边缘端人脸增强方案 1. 为什么在边缘设备上跑人脸增强?——从云端到桌面,再到指尖 你有没有试过用手机拍一张逆光人像,结果发现连眼睛轮廓都糊成一片?或者翻出十年前的老照片…

作者头像 李华
网站建设 2026/6/9 21:02:11

解锁UEFI美学:让开机画面成为个人数字签名

解锁UEFI美学:让开机画面成为个人数字签名 【免费下载链接】HackBGRT Windows boot logo changer for UEFI systems 项目地址: https://gitcode.com/gh_mirrors/ha/HackBGRT 问题:当开机画面成为数字身份的空白画布 想象两个场景:普通…

作者头像 李华
网站建设 2026/6/10 13:38:22

GPEN新手必看:从安装到高清人像生成的完整流程

GPEN新手必看:从安装到高清人像生成的完整流程 1. 这不是普通放大,而是一次“数字面部重生” 你有没有试过翻出十年前的毕业照,却发现连自己眼睛都看不清?或者用AI画图工具生成了一张惊艳的肖像,结果五官扭曲得像抽象…

作者头像 李华
网站建设 2026/6/10 10:42:04

SenseVoice Small语音识别:开箱即用的多语言转写工具

SenseVoice Small语音识别:开箱即用的多语言转写工具 1. 这不是又一个“能跑就行”的语音工具,而是真正省心的听写伙伴 你有没有过这样的经历:会议录音堆在文件夹里,迟迟没时间整理;采访素材录了半小时,光…

作者头像 李华