news 2026/4/16 15:51:49

损失函数专题

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
损失函数专题

这段时间在看一篇文章,但是当文章讲到损失函数部分时我就开始有点模糊了,因为我记不起来损失函数的相关数学概念了,那就从下面三个方面来对知识点进行巩固:

  • 损失函数基本概念
  • 损失函数数学原理
  • 常见损失函数

1. 损失函数基础概念:是衡量模型预测结果与真实标签之间差异的数学函数

在监督学习中,我们的核心目标是找到最优参数 ,使得损失函数最小化:

2. 损失函数数学原理:

比较两个概率模型(一个是确定的现实模型,一个是我们设计的概率模型)

1最小二乘法:

这里的1/2是为了求导方便

2最大似然:

概率是从事件推结果,似然是从结果(概率)推事件

似然函数的推导过程:

这里使用log将连乘变成连加(同时log不改变其单调性)

添加-号将寻找最大值问题变成寻找最小值

3信息论基础:

不同类型的模型可以使用熵来进行统一衡量,熵越大越混乱,此处应该寻找熵的最小值

信息量:一个系统从不确定变得确定难度有多大

为满足逻辑(下图公式2)自洽则信息量公式中应该有log

熵的计算公式:

相对熵(KL散度):这里是以P为基准,看Q与P的距离

交叉熵:(这里P是人脑对应的模型,Q是用于分类的模型,此任务用于判断是不是猫)

3. 较为常见的损失函数两类:

(1)均方差损失函数(MSE)

通过计算模型预测值与真实值之间差值的平方的平均值,衡量回归任务中预测结果的准确性,旨在使预测值尽可能接近真实值。

(2)交叉熵损失函数(CE)

用于衡量分类任务中模型预测的概率分布与真实标签之间的差异,旨在通过最小化损失来使模型预测更加接近真实类别。

结合不同任务特性选用适配的损失函数,可参考知乎文章:(59 封私信 / 30 条消息) 深度学习损失函数完全指南:理论、实现与应用 - 知乎

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 15:21:14

Hetty安全测试工具视觉优化秘诀:从疲劳到高效的专业设置

在网络安全测试的漫长征程中,视觉疲劳往往是影响效率的隐形障碍。Hetty作为专为安全研究设计的HTTP工具包,其精心调校的深色视觉系统为专业人士提供了理想的解决方案。本文将揭示如何通过Hetty的视觉优化设置,实现从眼睛疲劳到高效工作的完美…

作者头像 李华
网站建设 2026/4/16 12:00:48

Linux服务器安装flash_attn

方法一:直接尝试pip: pip install flash_attn可能出现报错: pip install flash-attn -i https://pypi.tuna.tsinghua.edu.cn/simple Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple Collecting flash-attnUsing cached http…

作者头像 李华
网站建设 2026/4/15 13:54:15

第三只眼睛:当 AI 重构人类视觉革命 —— 中国 EyeReal 裸眼 3D 技术如何撕开未来的裂缝?

引言 | 凌晨三点的复旦大学实验室,26 岁的博士生李默盯着显微镜下跳动的数据流,突然按下暂停键 —— 这串由 AI 算法生成的 3D 坐标,正将他的视网膜变成「立体画布」。 就在三个月前,他带领的团队刚刚让这项技术登上《Nature》封面,而此刻,他们正在改写一个更残酷的现实…

作者头像 李华
网站建设 2026/4/16 13:53:28

终极HTML压缩神器:minify-html如何让网页加载速度飙升?

终极HTML压缩神器:minify-html如何让网页加载速度飙升? 【免费下载链接】minify-html Extremely fast and smart HTML JS CSS minifier, available for Rust, Deno, Java, Node.js, Python, Ruby, and WASM 项目地址: https://gitcode.com/gh_mirror…

作者头像 李华
网站建设 2026/4/16 3:04:06

解锁chan.py:构建专业缠论分析系统的7个关键步骤

解锁chan.py:构建专业缠论分析系统的7个关键步骤 【免费下载链接】chan.py 开放式的缠论python实现框架,支持形态学/动力学买卖点分析计算,多级别K线联立,区间套策略,可视化绘图,多种数据接入,策…

作者头像 李华
网站建设 2026/4/12 20:00:51

以田间除草为喻:敏捷研发中流程规范与工具的动态平衡

从除草看敏捷:一场关于秩序与效率的永恒博弈2025 年 6 月,某互联网巨头宣布全面重构敏捷研发体系,引发行业震动。这个拥有 5000 人研发团队的科技巨头,曾因过度依赖自动化工具导致流程僵化,最终在一次关键项目中因需求…

作者头像 李华