news 2026/4/16 13:39:35

13.3 变分自编码器:重参数化技巧、ELBO与后验坍缩

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
13.3 变分自编码器:重参数化技巧、ELBO与后验坍缩

13.3 变分自编码器:重参数化技巧、ELBO与后验坍缩

变分自编码器是一种基于变分推断原理的深度生成模型,它通过一个编码器-解码器结构将概率生成模型与神经网络相结合,旨在学习数据的高效、连续的潜在表示。与只能进行确定性编码的自编码器不同,VAE引入了隐变量的概率分布,使其能够从学习到的潜在空间中进行随机采样并生成新的数据样本[1]。本节将深入解析VAE的三个核心支柱:变分下界重参数化技巧以及训练中常见的挑战后验坍缩

13.3.1 从自编码器到概率生成模型

标准自编码器由编码器和解码器组成,通过学习将输入数据x xx压缩为低维潜在编码z zz(编码过程),再尽可能准确地重建x xx(解码过程)。其目标是最小化重建误差,如均方误差。然而,标准的自编码器存在两个主要缺陷:

  1. 潜在空间不规则性:学习到的潜在空间可能是不连续或不平滑的,导致对潜在点z zz进行插值或随机采样时,解码器可能产生无意义或低质量的输出。
  2. 非概率性:它是一个确定性映射,无法直接用于生成新的、多样化的数据。

VAE通过将编码过程概率化来解决这些问题。VAE假设每个真实数据点x xx都由某个未观察到的连续隐变量z zz生成。具体来说,数据生成过程是:先从先验分布p ( z ) p(z)p(z)(通常为标准正态分布N ( 0 , I ) \mathcal{N}(0, I)N(0,I))中采样一个潜在变量z zz,然后从由参数化分布p θ ( x ∣ z ) p_{\theta}(x|z)pθ(xz)(由解码器建模)中生成数据x xx。我们的目标是最大化所有数据点的边际似然p θ ( x ) = ∫ p θ ( x ∣ z ) p ( z ) d z p_{\theta}(x) = \int p_{\theta}(x|z)p(z) dzpθ(x)=pθ(xz)p(z)dz。由于这个积分难以直接计算(涉及难以处理的后验分布p θ ( z ∣ x ) p_{\theta}(z|x)pθ(zx)),VAE引入变分推断来近似求解。

13.3.2 证据下界:变分推断的核心

为了最大化真实的数据似然log ⁡ p θ ( x ) \log p_{\theta}(x)logpθ(x),VAE引入一个由编码器建模的变分分布q ϕ ( z ∣ x ) q_{\phi}(z|x)qϕ(zx)来逼近真实但未知的后验分布p θ ( z ∣ x ) p_{\theta}(z|x)pθ(zx)。通过数学推导,可以将对数似然分解为:
log ⁡ p θ ( x ) = D K L ( q ϕ ( z ∣ x ) ∥ p θ ( z ∣ x ) ) + L ( θ , ϕ ; x ) \log p_{\theta}(x) = D_{KL}(q_{\phi}(z|x) \parallel p_{\theta}(z|x)) + \mathcal{L}(\theta, \phi; x)logpθ(x)=DKL(qϕ(zx)pθ(zx))+L(θϕ;x)
其中,D K L ( ⋅ ∥ ⋅ ) D_{KL}(\cdot \parallel \cdot)DKL()表示KL散度,用于衡量两个分布的差异。由于KL散度非负,因此有:
log ⁡ p θ ( x ) ≥ L ( θ , ϕ ; x ) \log p_{\theta}(x) \geq \mathcal{L}(\theta, \phi; x)log

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/12 16:40:07

36、Windows Messenger使用全攻略

Windows Messenger使用全攻略 在当今数字化的时代,即时通讯工具成为了人们日常交流中不可或缺的一部分。Windows Messenger作为一款经典的通讯软件,为用户提供了便捷的联系人管理、消息交流、文件传输以及音视频通话等功能。下面将详细介绍Windows Messenger的各项使用方法。…

作者头像 李华
网站建设 2026/4/13 1:20:01

46、Windows XP 系统维护与优化全攻略

Windows XP 系统维护与优化全攻略 在使用 Windows XP 系统的过程中,我们会遇到各种系统维护和优化的需求,比如卸载应用程序、清理桌面、系统还原、备份和恢复文件等。下面为大家详细介绍这些操作的具体步骤和相关注意事项。 1. 卸载应用程序 当我们安装应用程序时,它会将…

作者头像 李华
网站建设 2026/4/16 10:09:53

Redis 向量检索与传统向量数据库的性能差异

Redis 向量检索与传统向量数据库的性能差异 一 关键指标横向对比指标Redis 8 向量检索传统专用向量数据库&#xff08;如 Milvus、Pinecone、Weaviate&#xff09;查询延迟&#xff08;P50/P95&#xff09;本地/同机房常见 <1 ms&#xff08;多线程引擎&#xff09;&#xf…

作者头像 李华
网站建设 2026/4/14 21:50:34

Excalidraw内容营销策略建议:博客与视频结合

Excalidraw内容营销策略建议&#xff1a;博客与视频结合 在技术写作和知识传播的日常实践中&#xff0c;你是否曾为一张配图耗费数小时&#xff1f;是否在录制教学视频时&#xff0c;因无法实时标注而反复暂停重录&#xff1f;传统的图表工具虽然精确&#xff0c;却常常显得冰冷…

作者头像 李华
网站建设 2026/4/16 7:27:20

Excalidraw工单系统接入:Jira或Zendesk?

Excalidraw 工单系统集成&#xff1a;为何 Jira 与 Zendesk 都在拥抱这支“数字笔”&#xff1f; 在一次深夜的线上故障排查中&#xff0c;运维工程师小李收到了一条模糊的告警通知&#xff1a;“用户登录失败&#xff0c;错误码 500”。他点开 Jira 工单&#xff0c;本以为能看…

作者头像 李华
网站建设 2026/4/11 15:00:30

Excalidraw密码策略强度要求设定建议

Excalidraw 密码策略强度要求设定建议 在现代企业协作环境中&#xff0c;一个看似简单的绘图工具也可能成为安全防线的突破口。Excalidraw 作为广受欢迎的开源手绘风格白板工具&#xff0c;正被越来越多团队用于绘制架构图、产品原型和流程设计。这些图表中往往包含尚未公开的…

作者头像 李华