小杯Gemini战胜GPT5.2，1分钟模拟Windows操作系统-编程阁

一水发自凹非寺
量子位 | 公众号 QbitAI

谷歌丢出Gemini 3 Flash，给AI圈示范了啥叫：小孩子才做选择题，成年人当然是全都要（doge）。

一个公式来形容这款新模型：Gemini 3 Flash=Pro级智能+Flash级速度+更低价格。

比速度，它几乎是Gemini 2.5 Pro的3倍，实测更是丝滑到起飞：

比智能，它更是在多个经典测试中，战胜了包括Gemini 3 Pro、GPT5.2在内的一众顶尖模型。

数图中有多少根手指，GPT5.2张口就来“5根”，而Gemini 3 Flash成功识破陷阱并给出正确答案“6根”。

画一张骑车的鹈鹕，Gemini 3 Flash（右上）的表现明显优于Gemini 2.5 Pro（左）和Gemini 3 Pro（右下），而且这些还都是反复测试后抽取的最佳结果。

考察眼力环节，看模型们是否认识“谷歌宣传委员”Logan kilpatrick。

Gemini 3 Flash率先答对，而Gemini 3 Pro将他误认为Gemini前负责人Jack Krawczyk（已于今年4月离职并转投Meta）。

在更多测试中，Gemini 3 Flash都展示出自己不俗的综合实力。

虽然叫“Flash”，但其实是谷歌迄今最强智能体模型

敲黑板，这款模型即日起已面向全球所有用户推出：

普通用户可通过Gemini应用以及谷歌搜索的AI模式使用；专业开发者可在Google AI Studio、Gemini CLI以及谷歌全新的智能体开发平台Google Antigravity中，通过Gemini API进行调用和集成。

同时，企业客户也可通过Vertex AI和Gemini Enterprise两大平台获取其服务。

整体而言，Gemini 3 Flash还是继承了Gemini 3 Pro的复杂推理能力、多模态和视觉理解能力、Vibe编程能力，以及处理智能体任务的能力，只不过响应速度更快。

谷歌官方表示，这是他们迄今为止“在智能体工作流程方面最出色的模型”。

话不多说，我们这就看看Gemini 3 Flash能做什么以及实际表现如何？

比如让它创建一个功能完整、美观的Windows操作系统，核心环节几乎用时不到一分钟（视频未加速）。

分享该测试的网友表示，“这是一款令人叹为观止的模型”。

还能用来直接生成游戏，网友所使用的提示词如下：

用代码为我创建一个《侠盗猎车手6》游戏，并尽可能使其逼真，添加您选择的任何功能。

游戏的感觉有了，只不过画面仍有一定提升空间。

不过如果换成一些难度稍低一点的小游戏，效果倒还不错。

而用它来生成一张天气卡的效果be like：

肉眼可见设计更高级，并且交互效果更丰富。

最后我们简单上手实测一下，让它给自己生成一个介绍网站。

经过实测，网站上面的测速功能可以正常使用，不只是个空有前端的“花架子”：

而且点击“立即体验”按钮后，也确实能跳转到Gemini的官网网页。

这波看下来，你觉得Gemini 3 Flash表现如何？

性能速度双双超越2.5 Pro，价格却低得多

此外，官方测评显示，Gemini 3 Flash主打一个“加速不降智”。

性能上不仅显著超越Gemini 2.5 Pro，而且在专业多模态测试MMMU Pro、复杂推理测试ARC-AGI-2等方面，还能略胜Gemini 3 Pro。

更重要的是，它还在性能、成本和速度方面突破了帕累托极限——速度比Gemini 2.5 Pro快3倍，平均使用的token数量却少30%。

价格方面，Gemini 3 Flash相比前几代模型更具性价比。

其每百万输入token为0.5美元，每百万输出token为3美元（音频输入价格仍为每百万输入token 1美元）。

虽然略贵于Gemini 2.5 Flash（每百万输入0.3美元/每百万输出2.5美元），但考虑到其性能和速度，这一价格仍然相当具有吸引力。

（Gemini 2.5 Pro价格为，每百万输入1.25美元/每百万输出10美元。）

至此，谷歌Gemini 3算是集齐了全部家族成员，包括之前的Pro和Deep Think深度思考版。

而且说到思考模式，根据开发者文档，这次的Gemini 3 Flash一共有四档思考模式——minimal、low、medium、high。

只需看一眼图片效果演进，你就知道这几档的区别了（doge）：

One More Thing

有意思的是，Gemini 3 Flash发布后，谷歌这边还立马开了一个《宝可梦：水晶版》的直播。

两位对战选手分别是Gemini 3 Flash和Gemini 3 Pro。

虽然最终结果还没有出来，但初步来看Gemini 3 Pro暂处于领先地位。

有网友还惊喜发现，Gemini 3 Pro在游戏中似乎已经展现出某种系统级思考能力。

感兴趣的童鞋也可以蹲一波结果了~以及坐等一个反转。

参考链接：
[1]https://x.com/OfficialLoganK/status/2001428651121025391?s=20
[2]https://x.com/simonw/status/2001424152763470238?s=2
[3]https://blog.google/products/gemini/gemini-3-flash/

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

—完—