news 2026/5/11 20:06:46

Google DeepMind 重大更新 Gemini API File Search:多模态、元数据过滤与页码引用齐上阵

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Google DeepMind 重大更新 Gemini API File Search:多模态、元数据过滤与页码引用齐上阵

Google DeepMind 团队宣布对 Gemini API 的 File Search 工具进行重大扩展,推出多模态支持、自定义元数据过滤和页码级引用三项核心功能更新,助力开发者构建 RAG 系统。

多模态处理能力革新

长期以来,RAG 系统检索局限于文本,此次更新引入基于 Gemini Embedding 2 模型的多模态处理能力,能同时理解图像与文本。开发者可用自然语言检索图片,如创意 agency 可按情绪氛围找视觉资产,新模型处理图片文字表现出色。

自定义元数据过滤提效

在大规模数据管理中,检索噪音影响 RAG 效率。Google 推出的自定义元数据功能,允许用户为文件附加键值对标签,查询时通过元数据过滤器限定范围,减少干扰,提升检索速度与结果准确性。

页码级引用增强可信度

当模型从大型 PDF 文档提取答案时,页码级引用会自动记录索引信息来源页码,用户可直接跳转验证,增强模型可解释性和可信度,对事实核查场景重要。

开发便捷性提升

开发者可通过 google - genai 库快速上手,Google 提供完整开发指南和 API 文档,让开发者将重心转移到应用创新。目前,File Search 三项新功能已向 Gemini API 用户开放。

编辑观点:此次更新增强了 File Search 工具的功能,有望推动 RAG 系统发展,为开发者带来更多便利,也将提升数据处理和检索效率,在相关领域或引发新变革。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/11 20:06:12

ChatGPT写论文被判AI怎么办?降AI率完整应对攻略+工具推荐!

ChatGPT写论文被判AI怎么办?降AI率完整应对攻略工具推荐! ChatGPT 是 2022 年起最早被广泛使用的大模型,现在依然是不少留学生、研究生写英文论文/中文论文的首选。但它写出来的论文在 AIGC 检测平台(Turnitin、知网英文模块、维普…

作者头像 李华
网站建设 2026/5/11 20:05:55

Gemini字幕准确率从76.3%→94.1%:我们逆向分析了Google 127个内部测试用例,提炼出这7条语音预处理黄金规则

更多请点击: https://intelliparadigm.com 第一章:Gemini字幕准确率跃升94.1%的核心洞察 Google近期在多模态语音-文本对齐任务中对Gemini Pro 1.5模型进行了专项优化,重点重构了音频特征编码器与字幕生成解码器之间的跨模态注意力机制。实…

作者头像 李华
网站建设 2026/5/11 20:00:08

如何一次性解决Windows系统“应用程序无法启动“的终极指南

如何一次性解决Windows系统"应用程序无法启动"的终极指南 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 你是否曾经遇到过这样的情况:下载…

作者头像 李华
网站建设 2026/5/11 19:59:41

ChatReviewer:基于大语言模型的智能代码审查助手实战指南

1. 项目概述:当代码审查遇上AI助手 在软件开发团队里,代码审查(Code Review)是保证代码质量、促进知识共享、统一编码规范的关键环节。但现实情况往往是,资深工程师时间宝贵,新人提交的代码量大且细节繁杂…

作者头像 李华
网站建设 2026/5/11 19:50:34

NemoClaw资源导航:从Awesome列表构建到高效使用指南

1. 项目概述:一个为“NemoClaw”而生的资源宝库 如果你正在寻找一个关于“NemoClaw”的、经过筛选和整理的高质量资源集合,那么你很可能已经听说过或者正在寻找 VoltAgent/awesome-nemoclaw 这个项目。在开源世界里,以 awesome- 为前缀的…

作者头像 李华