news 2026/4/16 15:04:12

谷歌Gemini Deep Research Agent横空出世,成本仅GPT-5 Pro 10%却性能相当,开发者福音!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
谷歌Gemini Deep Research Agent横空出世,成本仅GPT-5 Pro 10%却性能相当,开发者福音!

谷歌推出基于Gemini 3.0的Deep Research Agent,性能媲美GPT-5 Pro但成本仅为其10%。该智能体在多项基准测试中表现优异,采用并行探索策略时准确率可从72.2%提升至89.5。谷歌通过API向开发者开放此能力,支持私有文档与全网数据混合分析,提供结构化报告与溯源引用,助力开发者构建下一代应用,重塑高门槛行业生产力。


OpenAI 还没登场,谷歌先亮剑了!双 12 这一天,谷歌提前 1 小时截胡 GPT-5.2,低调上线基于 Gemini 3.0 的 Deep Research Agent。高手过招,往往就在毫厘之间。

今天,我们推出了 Gemini Deep Research agent(Gemini 深度研究智能体),将我们领先业界的深度研究体验带给广大开发者。借助这一工具,开发者可以首次将 Google 最先进的自主研究能力直接集成到自己的应用程序中。

据 Google DeepMind 产品经理 Lukas Haas 在 X 上的透露,Gemini Deep Research Agent 正在重塑大模型领域的“性能-成本”曲线。这款新智能体不仅以 46.4% 的得分在 Google 新基准测试中确立了 SOTA 地位,更在 BrowseComp 任务中证明了自己拥有与 GPT-5 Pro 同台竞技的实力。当然,其最具颠覆性的优势在于成本控制——它以仅相当于 GPT-5 Pro 10% 的价格,实现了同等级别的深度研究能力。

非常兴奋能发布 Gemini Deep Research Agent(Gemini 深度研究智能体)!

它在完整的 HLE (Humanity’s Last Exam) 数据集上达到了 46.4% 的业界领先水平 (SoTA);在我们即将发布的新基准测试 DeepSearchQA 上也是如此;在 BrowseComp 上,它的表现与 GPT-5 pro 相当,但成本却低了一个数量级。

Lukas Haas 进一步展示了该 Agent 在“推理时间扩展(Inference Time Scaling)”上的惊人潜力。最新数据显示,当允许 Agent 并行探索多条路径并进行相互验证(即 pass@8 策略)时,其在 DeepSearchQA 核心子集上的准确率能从单次尝试的 72.2% 一路飙升至 89.5%。这意味着,只要给 AI 足够的“思考”空间去像人类专家一样反复推敲不同线索,它在处理高难度的私有语料库或全网深度调研时,就能产出精确度极高且逻辑严密的综合性研究报告。

Google DeepMind 正将“深度研究”能力从单一的实验性工具转化为无处不在的生态基础设施,这一变革将通过全面植入 Google 搜索、NotebookLM 及金融板块,并配合包含 900 个高难度因果链任务的 DeepSearchQA 基准测试,彻底解决 AI 在复杂逻辑推理中“不仅要搜到,更要懂逻辑”的核心痛点。这种“慢思考”的高精度研究能力已迅速在产业界兑现价值,从金融机构的自动化合规尽调,到合作伙伴 Axiom Bio 在药物毒性分析上的突破,均证明了其在重塑高门槛行业生产力上的巨大潜能。

为了让这种能力真正普惠化,Google 向开发者开放了 Interactions API 和 A2A 协议,这意味着开发者不仅能轻松构建融合本地文档与全网数据的下一代应用,还能获得精准的结构化报告与溯源引用。随着未来原生图表生成、MCP 协议支持及企业级 Vertex AI 部署的落地,一个“不仅懂搜索,更懂深度分析”的专家级智能应用生态正在加速形成。

如何在后台启动研究任务并轮询结果。

import time from google import genai client = genai.Client() interaction = client.interactions.create( input="Research the history of Google TPUs.", agent='deep-research-pro-preview-12-2025', background=True ) print(f"Research started: {interaction.id}") while True: interaction = client.interactions.get(interaction.id) if interaction.status == "completed": print(interaction.outputs[-1].text) break elif interaction.status == "failed": print(f"Research failed: {interaction.error}") break time.sleep(10)

在工具配置层面,Deep Research Agent 实现了“开箱即用”与“深度定制”的平衡。它默认内置了 Google Search 和 url_context 组件,这意味着开发者无需任何额外设定,Agent 就能直接调用 Google 搜索并深度读取公共网页内容。更关键的是,如果需要让 AI 的研究基于您独有的私有数据(如内部报告或文献库),只需显式添加 File Search 工具即可。这一简单的配置能立刻激活类似 RAG(检索增强生成)的能力,让 Agent 在保护数据隐私的同时,将您的专属文档与全网信息进行交叉验证与混合推理。(用这个功能写文献综述贼爽)

import time from google import genai client = genai.Client() interaction = client.interactions.create( input="Compare our 2025 fiscal year report against current public web news.", agent="deep-research-pro-preview-12-2025", background=True, tools=[ { "type": "file_search", "file_search_store_names": ['fileSearchStores/my-store-name'] } ] )

指示词示例:

角色设定:

你现在是我的博士研究助理,专精于[研究方向]。

任务背景:

我正在撰写题为《研究题目》的博士学位论文。我已经上传了相关的核心文献(见附件)。

你的任务:

请综合利用我上传的【私有文档】以及【Google Search 网络搜索】,针对以下主题进行深度调研和综述撰写:

“[具体的研究问题]”

具体要求(请严格执行):

  1. 多源交叉验证:

    • 优先分析我上传的文档,提取其中的核心观点、评估模型和实证数据。

    • 利用 Deep Research 搜索网络上(特别是近3年)最新的相关研究,补充我文档中可能缺失的最新趋势或反例。

    • 关键:请找出私有文档与网络新信息之间的“因果链”或矛盾点(例如:某篇旧文献提出的评估框架,是否在最新的文献中被修正或推翻?)。

  2. 结构化输出(Markdown):

    请按照以下逻辑结构生成报告:

    • 核心概念界定:定义[重要的概念]。

    • 现状与痛点:目前[研究问题]的主要表现(引用具体数据或案例)。

    • 理论模型对比(表格):制作一个表格,对比不同学者提出的“一致性评估框架”(包括维度、指标、适用性)。

    • 研究缺口(Gap Analysis):基于上述分析,指出当前研究尚未解决的问题,为我的论文选题提供依据。

  3. 引用规范:

    • 每一个观点必须标注精确来源。如果是来自上传的文件,请标注 [文件名, 页码];如果是来自网络,请标注 [URL/作者, 年份]。

​最后

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包:

  • ✅AI大模型学习路线图
  • ✅Agent行业报告
  • ✅100集大模型视频教程
  • ✅大模型书籍PDF
  • ✅DeepSeek教程
  • ✅AI产品经理入门资料

完整的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇
​​

为什么说现在普通人就业/升职加薪的首选是AI大模型?

人工智能技术的爆发式增长,正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议,到全国两会关于AI产业发展的政策聚焦,再到招聘会上排起的长队,AI的热度已从技术领域渗透到就业市场的每一个角落。


智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200%,远超其他行业平均水平;整个人工智能行业的求职增速达到33.4%,位居各行业榜首,其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张,也让人才供需矛盾愈发突出。麦肯锡报告明确预测,到2030年中国AI专业人才需求将达600万人,人才缺口可能高达400万人,这一缺口不仅存在于核心技术领域,更蔓延至产业应用的各个环节。

​​

资料包有什么?

①从入门到精通的全套视频教程⑤⑥

包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

④各大厂大模型面试题目详解

⑤ 这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频教程由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

​​​​

如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓**

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 9:01:04

Dify Agent扩展开发:为什么顶尖团队都在悄悄布局这项技术?

第一章:Dify Agent扩展开发的技术趋势与行业洞察随着人工智能工程化落地的加速,Dify Agent作为连接大模型能力与具体业务场景的核心枢纽,其扩展开发正成为企业智能化升级的关键路径。开发者通过定制化插件、工具集成和上下文增强机制&#xf…

作者头像 李华
网站建设 2026/4/16 9:04:09

以产品为核 以服务为翼 顶点财经构建财经服务新生态

自2007年创立以来,顶点财经始终扎根证券投资服务领域,凭借十八年的深耕积淀,从一家跨媒体财经内容提供商,逐步成长为兼具专业实力与科技底蕴的正规财经服务机构。依托210余项荣誉资质与多项技术专利加持,顶点财经以“摇…

作者头像 李华
网站建设 2026/4/16 11:01:12

AI产品核心差异的五大维度

AI产品核心差异的五大维度 抛开具体产品,从技术底层到应用层,主流AI的差异可归纳为以下核心维度,这些维度直接决定产品的适用边界:1. 技术定位:开源与闭源的路线分野这是最根本的差异,直接影响开发者使用权…

作者头像 李华
网站建设 2026/4/15 13:09:01

企业差旅成本优化指南:三大平台助您实现高效出行管理

在当今竞争激烈的商业环境中,企业差旅成本控制已成为财务管理的重要环节。据2024年企业出行调研报告显示,差旅费用通常占据企业运营成本的15%-25%,如何选择合适的差旅平台实现成本优化,已成为众多企业管理者的核心关切。本文将深入…

作者头像 李华
网站建设 2026/4/15 20:23:46

Dify+PDF加密权限控制(仅限高级用户掌握的5个关键技术点)

第一章:加密 PDF 的 Dify 权限验证 在现代文档安全体系中,对敏感 PDF 文件进行加密并结合权限控制系统已成为企业级应用的标准实践。Dify 作为一款支持可扩展插件架构的低代码平台,能够通过自定义节点实现对加密 PDF 文件的访问控制与权限验证…

作者头像 李华