news 2026/6/10 21:03:58

【必看】Google Tiger模型揭秘:生成式检索如何颠覆传统搜广推架构?建议收藏!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【必看】Google Tiger模型揭秘:生成式检索如何颠覆传统搜广推架构?建议收藏!

文章介绍了生成式检索技术如何颠覆传统"多层漏斗"的检索范式,以Google的Tiger模型为例,详细解析了其通过RQ-VAE技术实现语义ID生成的方法。生成式检索将模型参数作为全库商品索引,直接生成推荐结果,解决了传统检索中多级目标不一致和漏斗折损问题。这一技术正从召回、排序到端到端重塑整个检索技术范式,标志着检索领域Scaling Law时代的到来。


  1. 背景
    =====

伴随大模型技术的发展,为传统基于"多层漏斗"(召回-粗排-精排等)范式的检索技术带来了新的探索路径,各类基于生成式模型的检索技术,开始在业界的多种业务场景中逐步落地,生成式检索这种新的检索范式逐渐成为未来检索技术发展的新方向之一。

1.1. 什么是检索

检索任务本质是就一种匹配,我们熟知的**搜广推任务,**不管是业务、还是技术上,**本质上都是一种检索任务,这也是为什么大家常说:**搜广推是一家。

1.1.1. 从业务上

* 搜索是『有query』的推荐 * 推荐是『query=用户信息』的搜索 * 广告与推荐的主要差异,是推荐的主体以及业务目标

1.1.2. 从技术上

经典检索技术的整体框架,搜广推也基本一致:

插句题外话:当前业界大部分搜广推类产品,都在探索如何通过内容生产+推荐+检索等多环节协同联动,持续提升用户体验,提升产品竞争力。

  • 搜推协同,定向生产

  1. 传统检索技术
    =========

2.1. 召回模块

召回:从整个候选内容集合中,初步检索出可能相关的内容候选,追求低耗时、多样性等。

  • **第一代:**倒排索引-召回

原始文档:

构建索引:

键值(索引) - 倒排链(链内排序+截断)

**例如:**长短期兴趣召回、热度召回、冷启动召回

**优势:**技术方案简单(ES、KV数据库就能满足

  • **第二代:向量召回->两段式->**图向量召回

原始文档:

核心步骤:

  • **Step1:**基于用户行为序列构图(同构图、异构图…)
  • **Step2:**生成Item/Uesr向量
  • 随机游走方式:①深度:Deepwalk算法;②深度+广度:Node2vec算法;
  • 采样的方式:GCN(基于谱域的图卷积神经网络)、GraphSage(基于空间域,采样邻居)、PinSage(投票选取邻居)等;

**主要问题:**图模型的增量训练成本高,难以在线学习(时效性差),导致实际业务中落地门槛高(当前主流推荐场景基本都需要实时在线推荐)

  • **第二代:向量召回->两段式->**双塔模型类召回

主要步骤:

(1)离线训练索引模型

  • 直接使用词向量类模型:word2vec/Bert等
  • 基于业务数据训练向量模型:矩阵分解(协同过滤)、DSSM等

(2)建立向量库:在线通过计算内积的方式检索Top k

代表:各类的双塔模型

两段式召回的问题:

  1. 建模与在线检索目标不一致(训练输出层中使用sigmoid/softmax,并在推理时转向使用ANN计算内积)
  2. 计算点积的方式,限制了模型表达能力
  • 第二代:向量召回->一段式-向量召,交替优化索引模型与索引结构,联合建模…

**经典:**阿里的TDM(Tree-based Deep Model ,2018)

TDM基于树结构,提出了一套对用户兴趣度量进行层次化建模与检索的方法论。

基本原理是使用树结构对全库item进行索引,然后训练深度模型以支持树上的逐层检索,从而将大规模推荐中全库检索的时间复杂度由O(n)下降至O(log n)【n为全库物品数量】。

**①叶子结点:代表所有的物品;②上层节点:**聚类虚拟出来的

检索任务转换成了如何从树中检索一系列叶节点,作为用户最感兴趣的物品返回。

其它业界方案:字节的DR模型(Deep Retrieval,2020年)

2.2. 排序模块

排序:在召回的候选集合中,使用更复杂策略选出更相关的内容(多目标、相关性等)

如何选择适合的CTR模型?
特征模型化轻特征,重模型:阿里派,使用简单的特征,使用复杂的模型,例如 DIE模型:在模型内引入自注意力等模型结构,完成各种特征交叉…
模型特征化重特征,轻模型【推理阶段更轻】 百度派,离线构造很多大量、高级特征,在线使用轻量化模型。 例如:百度大搜的上层排序还在大量使用GBrank类树模型,基本是这个思路(目前逐步被端到端的深度排序模型取代 )
  1. 生成式检索技术(GR,Generative Retrieval)
    ===================================

大模型技术的发展初期,主要是以离线构建高级特征的方式嵌入到各个子模块中,但这种方式限制了大模型能力。

当前基于大模型技术的生成式检索,通过引入端到端的生成模型(如基于Transformer的自回归生成模型等),输入用户的历史行为序列作,模型直接生成待推荐商品ID,模型的参数充当了全库商品的索引,充分释放大模型的能力。

传统检索范式 VS 生成式检索新范式

  • 传统检索-多级漏斗的范式

**(1)召回阶段:**基于简单、高效的方法(基于规则/策略的粗粒度匹配)来减少候选物料的数量(数亿->数千)

**(2)粗精排阶段:**在召回候选集合上,应用较复杂的排序算法,选择Top k个物料进行推荐。

  • 多级漏斗范式的问题

(1)存在多级漏斗,且每级都有固定配额限制,降低检索效率

(2)各级漏斗模型的优化目标不完全一致,容易出现漏斗折损

(3)工业界经过多年的迭代(卷),多级漏斗范式下的效果优化逐渐遇到瓶颈

  • 生成式检索范式的优势:

(1)简化了多层漏斗结构,实现从全量数据上检索最优Top k结果
(2)引入了大模型包含的先验知识+理解+推理等能力,针对冷启动(新用户/物品)更友好

3.1. 基础:如何基于LLM 构建检索系统

生成式检索的技术的本质:模型即索引,生成即检索。

基于自回归的LLM模型:

  • 简版实现思路(直接套用NLP领域LLM的方案):
  • 基于LLM模型基本思路,将商品ID当做文本分词后的Token,扩充词表后,直接训练基于商品ID序列生成下一个商品ID的能力,从而获得生成式检索模型。
  • 直接使用商品ID作为Token存在的问题**:**
  • 推荐中候选商品ID数量非常大(数亿+),因此直接基于原始的物品 ID训练LLM将导致词汇表非常大,并且推理效率低。
  • 只适用商品ID,没有利用上商品的文本、图像等信息,且冷启商品无法被推荐。

因此,如何实现商品ID化表示,是实现基于LLM的生成式检索第一个挑战,也是核心步骤,下面我们以谷歌的Tiger模型为案例学习一下他们是怎么解决这个问题的。

3.1.1. 实现生成式检索的核心步骤

主要参考2023.11谷歌发表的**TIGER****(Transformer Index for Generative Recommenders)**模型。

检索系统中的每个物品,除了本身有一个数字序号ID外,还包含一系列其它维度的特征,例如:标题(文本)、配图(图像)、配乐(音频)等。

如何表征一个物品作为索引,大致有3种方案:

汇总上述各种方案利弊:

3.1.2. 如何获得语义ID - 基于RQ-VAE的量化编码

3.2. 基于 Tiger 模型的生成式召回方案

3.2.1. 如何获取物品语义 ID ?

原始编码向量 --> RQ-VAE量化编码 --> 物品的语义ID

模型包含以下部分:

  • 编码器:通过各种预训练后的编码器模型,将物品的特征(文本、图像…)编码为一个稠密的连续向量。
  • 残差量化:(RQ-VAE):多级向量量化器,通过残差矢量从粗到细递归量化,以生成一组码字 (使用最近邻查找,将潜在向量映射到codebook中离散的嵌入向量,并返回向量下标,作为码字)
  • coodbook:量化使用了4个级别的残差量化,对于每个量化的阶段,都维护一个基数为 256 的码簿,码簿中的每个向量的维度为 32
  • **解码器:**输入离散的语义ID(对应向量求和) ,重构输入数据。

3.2.2. RQ-VAE模型自监督训练

训练过程以及损失:

  • 损失函数:同时训练编码器、量化器(语义ID)、解码器

论文中,h级码本(h=4个codebook),每个码本有K个码字,K=256。

使用长度为4的语义ID,即每个item由带有层次结构的语义ID四元组(L1, L2, L3,L4)表示。其中每个代码字具有256的基数(即,每个级别的码本大小= 256),可表征物品ID数量= 256^4。

【RQ-VAE损失】

  • 左侧(向量损失):用于学习语义ID向量空间(codebook),让被选择离散嵌入向量****e尽可能靠近编码器输出r。
  • 右侧(承诺损失):用于学习编码器的输出r,为了让编码器输出r尽可能靠近所选择的离散嵌入向量e 。

3.2.3 语义ID的最主要的特性:

例如:语义ID1= (10,21,22),与语义ID2 = (10,21,25)、语义ID3= (10,11,35)相比,与语义ID1与语义ID2更相似。

  • C1位置:捕捉商品信息中高级别类别特征,例如:当c1=3时,含有大量与"头发"相关的产品;多数c1=1的内容是"化妆"和"皮肤"等产品。
  • C2位置:固定C1位置的值,第二编码词c2能更精细地捕捉高阶语义信息

论文中:作者比较其他几种量化的替代方案,例如局部敏感哈希(LSH)、k均值聚类、VQ-VAE,都不能很好保留语义ID分层的性质。

3.2.4 语义ID存在的问题:

3.2.5. Tiger模型的训练

生成式模型的训练,即给定特定 <输入,输出> 下任务的prompt模板,对模型进行训练(自回归方式、GLM方式等),目标是最大化给定输入预测输出的条件似然。

**以生成式推荐任务为例(参考谷歌的****TIGER模型):**即输入是用户有行为的商品语义ID序列,输出是下一个商品语义ID。

  • ****第一部分:****Semantic ID generator模块
  1. 基于商品的信息(标题、配图…),经过对应的预训练编码器,生成商品词向量表征(稠密的、连续的)。
  2. 对词向量通过量化操作转换为为一组语义编码词的元组,将此元组称为item的语义ID(等价于VQ-VAE中的codebook)
  • 第二部分:训练端到端的自回归生成模型:
  1. 模型词汇表改造,新增商品的语义ID

  2. 模型输入信息:

    (1) 商品侧:用户交互过的商品序列,并用语义ID表征,例如Sem ID=(5,23,55)表征商品Item233。

    (2) 用户侧:论文中对用户ID也进行了表征为用户语义ID。

  3. 模型输出信息:模型直接生成语义ID,通过已有的语义ID->商品的映射关系,完成商品的检索。

3.2.6. 模型推理

推理阶段,给定用户输入表示,生成式检索模型通过自回归的方式生成下一个商品语义ID,直到生成一个完整的句子或序列。

案例:在生成式广告的关键词定向任务中推理阶段的主要难题

LLM生成的关键词,可能不是广告主购买过的广告词(为无效关键词,原始方案中生成的关键词70%都是无效的),可控性需要提升。

因此,在模型的推理阶段引入**基于Trie树的限制性解码方案****(**提升解码的效率+解码的准确性)。

  1. 总结
    =====

生成式检索技术发展与逐步落地,为未来检索技术带来了新的发展方向:

  1. 传统基于『多层漏斗的级联』的检索架构,逐步被端到端的生成式模型替代,有效的解决『多阶段目标不一致&漏斗层层折损』的难题,检索&研发效率进一步提升。
  2. 传统检索系统中,以『代码开发』为基础的分治研发,逐步转向以『数据采样与标注』为基础的研发,实现数据驱动(没有什么难题是标注几条数据解决不了的)。
  3. 生成式模型技术正在从召回(谷歌Tiger)、排序(Meta的HSTU)到端到端(快手的OneRec),逐步重塑整个检索技术范式,真正属于检索领域的Scaling Law时代正在到来,让子弹再飞一会 ~

AI时代,未来的就业机会在哪里?

答案就藏在大模型的浪潮里。从ChatGPT、DeepSeek等日常工具,到自然语言处理、计算机视觉、多模态等核心领域,技术普惠化、应用垂直化与生态开源化正催生Prompt工程师、自然语言处理、计算机视觉工程师、大模型算法工程师、AI应用产品经理等AI岗位。

掌握大模型技能,就是把握高薪未来。

那么,普通人如何抓住大模型风口?

AI技术的普及对个人能力提出了新的要求,在AI时代,持续学习和适应新技术变得尤为重要。无论是企业还是个人,都需要不断更新知识体系,提升与AI协作的能力,以适应不断变化的工作环境。

因此,这里给大家整理了一份《2026最新大模型全套学习资源》,包括2026最新大模型学习路线、大模型书籍、视频教程、项目实战、最新行业报告、面试题、AI产品经理入门到精通等,带你从零基础入门到精通,快速掌握大模型技术!

由于篇幅有限,有需要的小伙伴可以扫码获取!

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

4. 大模型项目实战

学以致用,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

5. 大模型行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

为什么大家都在学AI大模型?

随着AI技术的发展,企业对人才的需求从“单一技术”转向 “AI+行业”双背景。企业对人才的需求从“单一技术”转向 “AI+行业”双背景。金融+AI、制造+AI、医疗+AI等跨界岗位薪资涨幅达30%-50%。

同时很多人面临优化裁员,近期科技巨头英特尔裁员2万人,传统岗位不断缩减,因此转行AI势在必行!

这些资料有用吗?

这份资料由我们和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


大模型全套学习资料已整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费】

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 13:39:36

彼得林奇对公司技术栈更新能力的评估

彼得林奇对公司技术栈更新能力的评估关键词&#xff1a;彼得林奇、公司技术栈、更新能力评估、投资分析、技术创新摘要&#xff1a;本文深入探讨了彼得林奇对公司技术栈更新能力的评估方法。彼得林奇作为投资领域的传奇人物&#xff0c;其投资理念和分析方法备受关注。在当今科…

作者头像 李华
网站建设 2026/6/10 13:40:02

计算机毕业设计springboot非遗作品交易平台 基于SpringBoot的非遗手作电商与文化传承平台 SpringBoot框架下的传统工艺品在线商城与社区系统

计算机毕业设计springboot非遗作品交易平台&#xff08;配套有源码 程序 mysql数据库 论文&#xff09; 本套源码可以在文本联xi,先看具体系统功能演示视频领取&#xff0c;可分享源码参考。 非遗传承人守着好手艺&#xff0c;却苦于没有流量&#xff1b;消费者想买一把正宗的油…

作者头像 李华
网站建设 2026/6/10 12:34:17

有人问你粥可温,有人陪你改需求

腊八节&#xff0c;愿你的屏幕不卡顿&#xff0c;需求不反复&#xff0c;测试全通过&#xff0c;上线零事故&#xff01;寒冬腊月&#xff0c;键盘不冷&#xff1b;八方食材&#xff0c;汇成一行行优雅的代码。不论是前端“米”、后端“豆”&#xff0c;还是测试“枣”、运维“…

作者头像 李华