news 2026/4/15 18:24:01

错失200万!围观腾讯广告算法大赛决赛,我被这届00后的操作整破防了...

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
错失200万!围观腾讯广告算法大赛决赛,我被这届00后的操作整破防了...

家人们,不知道大家前段时间有没有关注广告推荐圈的“春晚”——腾讯广告算法大赛。

作为中国数据规模最大的全模态生成式推荐算法竞技场,决赛现场真是神仙打架。

今年我也去凑了个热闹,去现场围观决赛答辩。我受到的震撼比奖金还猛烈。。。

这届比赛一共集合了 8400 多位同学,组成了 2800 多支队伍。腾讯广告的算法大赛

这么多年一直都是一个主旨,就是设计算法让模型学会「预测用户下一刻可能感兴趣的广告」。

今年的冠军——Echoch 战队(由华科、北大、中科大大神组成),不仅抱走了巨额奖金,前 10 名战队成员更是全员拿到了腾讯 Offer 意向书。

但今天,我不只想聊钱(虽然我酸酸的),我更想和大家聊聊这次比赛背后透出的一个惊人趋势:推荐系统,已开始实打实地从“判别式”到“生成式 Agent”的范式更迭。

还记得我上大学那会儿参加这比赛,大家卷的是特征工程,比的是谁的模型融合了更多有效信息。

那时的逻辑是检索-排序-漏斗,做的是连线题—你点了 A,我推 B,主打一个基于历史数据的机械匹配。

而今年大赛,赛题已经升级成了全模态序列生成式推荐 (AMGR)。

现在的生成式推荐,做的是“填空题”—系统不再是连线,而更像一个智能 Agent。它通过观察你的行为序列,主动推理预测:“这人下一步想看啥?”

生成式模式对于解决推荐系统中最棘手的问题——冷启动来说,可以说是一个福音。

咱们举个例子:

假设平台刚上架了一款最新型的无人机。

在传统模式里, 因为没人点过,它是“隐形”的,系统面对这个冷启动商品只能干瞪眼,必须等积累了足够的点击数据(ID 关联)才能开始推荐。

在生成式模式里:玩法完全变了。

模型可以通过商品的图文、参数视频、材质描述等多模态信息,直接“读懂”它。系统会思考:“哦,这是一个外观酷炫、续航 30 分钟的飞行器,属于科技潮品。”

于是,即便这架无人机没有任何历史点击数据,系统也能立刻在语义世界中找到它的“邻居”,直接把它塞给那些虽然没买过无人机、但偏好向量高度匹配的“科技发烧友”。

所以,生成式推荐的真正变革在于:它让推荐系统从“统计概率”的旧世界,跨越到了“内容理解”的新大陆。

除了赛题范式的颠覆,今年的数据规模也着实把我吓了一跳。

腾讯广告直接把工业界的真实压力搬到了赛场上。

初赛阶段,先扔出一个 TencentGR-1M(百万级) 的全模态数据集给大家练手;到了复赛,数据量直接暴力翻倍,飙升至 TencentGR-10M(千万级)。

选手们必须基于用户的全模态历史行为(包括文本、视觉、协同行为等),去精准预测下一次交互。

更关键的变化是复赛中评分权重的重构:选手需要在历史序列和预估目标中同时引入“转化”行为。相比于基础的”点击“,精准预测用户的高价值“转化”行为将获得更高的得分回报。

但想拿高分并不容易,核心拦路虎在于多模态数据的高缺失率与低信噪比——特别是数据集中一些高噪的特征,如果不进行针对性、有效的清洗,模型极易陷入训练不收敛甚至性能倒挂的泥潭。

这里就不能再用传统的判别式框架“偷懒”了,必须探索生成式的创新方案。

下面咱一起细盘下冠军团队 Echoch(华科、北大、中科大联队)的方案。

队长在答辩的时候说了一句话:

理想的推荐系统,不应仅停留在‘因为常看旅游攻略就推机票’的表层关联,而应洞察到用户真正向往的是那里的自然风光。让推荐有温度、懂潜台词,才是核心目标。

为了实现从行为关联到猜测人心的跨越,Echoch 主要来了三步走:

首先是,架构上引入了 2024 年 Meta AI 推出的 HSTU (Hierarchical Sequential Transduction Unit)。

相比 Transformer,HSTU 让处理复杂行为序列的推理速度快了 5 到 15 倍,配合 RQ-VAE 技术,打破了过去仅靠 ID 点击率识别商品的局限,让系统直接“读懂”商品描述,实现了对 Item 的语义级理解。

在传统的 PinRec 思想里,“点击”和“转化”往往是冲突的(点得多不代表买得多)。

Echoch 对此提出了逐位置行为条件化。引入特征空间变换层。在预测“点击”时,模型用一套表征;而在预测“转化”时,FiLM 会把目标动作投射到另一个子空间。同一个用户序列,在不同目标下展现出截然不同的面貌。如果当前任务是搞转化,模型会自动在 Attention 机制中,给历史上那些“转化行为”加权。

同一个用户序列,在不同目标下展现出完全不同的面貌。

他们不仅构建了“时间特征”来区分随机点击和真实兴趣,还设计了“会话特征”,模拟用户的浏览决策心理,从零散数据中梳理出深层逻辑。

针对语义 ID 稀疏的痛点,这一招让那些平时没人看的“长尾商品”,训练关注度飙升了 190 倍,码表利用率直接从 81.2% 拉满到 100%。

最终,这套方案实现了线上核心指标 +0.013 的提升,且单卡显存占用神奇地减少了 5GB。

他们凭借这套技术方案,直接刷到榜一,团队的方案赢得了大赛评审团的高度评价。

看完这场比赛,如果不谈谈它背后的深层意义,我觉得这篇复盘是不完整的。

这场比赛释放了一个明确信号:未来的广告系统,不再是一个冰冷的点击率预估机器,而是一个具备“世界模型”认知的智能 Agent。

从猜你喜欢进化到懂你所想,从简单的流量分发进化到内容的实时生成与交互。

正如腾讯广告提到的“内外部系统全面 Agent 化”,当 AI 开始像人一样理解万物,广告推荐才算真正跨越了“匹配”与“理解”的鸿沟。

还有一点,让我非常触动!

决赛答辩现场,腾讯公司副总裁蒋杰那句“现在的学生与工业界几乎没有代差”,听得我热血沸腾:

以前几届的作品往往只能在一台机器上跑,现在基本都能直接拿来做分布式部署。他们不像我们当年读书的时候,出来以后啥也不会,要跟一个导师学半年。现在的学生对大模型的理解,以及做出来的东西,已经和工业界的实际工作非常接近了

确实是这样的!

这届大赛 20 强中 75% 是 00 后,还在校园里的学生们,就已经能够解决这么工业化的难题。

在 AI 基础设施日益完善、开源生态高度发达的今天,“经验”不再是绝对的壁垒,“视野”和“第一性原理”的思考才是。

即使这群还在象牙塔的年轻人未曾直面工业化的复杂,但不受传统路径依赖的束缚,让他们运用最新技术时能够挑战现有的经验壁垒。

最后,我想聊聊腾讯广告坚持办这个比赛的初衷。

在 AI 时代,算力和数据是昂贵的“入场券”。

高校有这些又新鲜又好用的顶尖大脑,却往往受困于没有工业级的数据和算力;企业有海量的工业场景和算力,但是受限于现有方案渴望突破性的算法模型。

腾讯广告算法大赛是一种让技术冲出论文在真实的商业土壤中落地生根的坚持,而这种坚持,是为行业储备能打人才的最佳练兵场!

期待明年继续办!我把传送门先给大家准备好,大家可以提前期待一波 ~

传送门:https://algo.qq.com/

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 13:32:16

无人机测绘技术专业:课程体系与就业方向的对应关系

无人机测绘技术专业:课程体系与就业方向的对应关系无人机测绘技术专业的课程体系与就业方向呈现“精准适配”的逻辑——课程模块围绕就业岗位的核心能力需求设计,职业本科独立专业以“应用落地能力”为纽带,普通本科相关方向以“研发设计能力…

作者头像 李华
网站建设 2026/4/15 23:54:23

如何用EmotiVoice实现零样本声音克隆?技术深度解析

如何用 EmotiVoice 实现零样本声音克隆?技术深度解析 在智能语音日益渗透日常生活的今天,我们早已不满足于“机器能说话”这一基本能力。用户期待的是更具个性、更有情感的语音交互体验——比如让 AI 用亲人的声音讲故事,或让游戏角色以愤怒的…

作者头像 李华
网站建设 2026/4/7 15:25:32

EmotiVoice情感控制参数详解:精细调节语音情绪变化

EmotiVoice情感控制参数详解:精细调节语音情绪变化 在虚拟主播深情演绎一首原创曲目,或游戏角色因剧情转折怒吼“你背叛了我!”的瞬间,我们早已不再满足于机械朗读式的语音输出。如今,用户期待的是有温度、有情绪、能共…

作者头像 李华
网站建设 2026/4/16 9:12:17

把 Vivado 项目放心交给 Git:一篇 FPGA 工程师必读的实战指南

之前分享过一篇文章《FPGA 版本管理三种方式:你会选哪一种?》,评论区很多人都推荐使用Git进行版本管理,今天这篇文章主题就是使用Git进行备份指南。在 FPGA 开发中,掌握 Git 等源码管理工具已经是必备技能。当然&#…

作者头像 李华
网站建设 2026/4/5 18:00:10

EmotiVoice多情感TTS系统:让AI语音更懂情绪表达

EmotiVoice多情感TTS系统:让AI语音更懂情绪表达 在虚拟助手开始陪你早起晨练、游戏NPC因你的一次操作失误而“愤怒咆哮”、有声书朗读竟能随着剧情高潮变得激动颤抖的今天,我们不得不承认——AI语音早已不再只是“念字机器”。用户要的不再是准确发音&am…

作者头像 李华
网站建设 2026/4/15 9:46:39

矩阵乘法 神经网络与大模型的核心计算引擎深度解析

目录 🎯 摘要 🏗️ 第一章 数学本质 从线性代数到神经网络计算图 1.1 矩阵乘法的计算复杂度演进 1.2 神经网络中的矩阵乘法变体 ⚙️ 第二章 硬件映射 NPU架构下的矩阵计算革命 2.1 昇腾达芬奇架构的Cube计算单元 2.2 内存层级与带宽瓶颈 &#…

作者头像 李华