news 2026/6/10 16:51:41

大模型从0到精通:判断力的灵魂——激活函数如何让AI“转弯“

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型从0到精通:判断力的灵魂——激活函数如何让AI“转弯“

本文是《大模型从0到精通》系列第二卷“构造篇”的第一章。第一卷“奠基篇”五章内容我们建立了完整框架:模型→损失→优化→网络结构→责任追溯。上一章我们知道,没有激活函数的深度网络只是‘纸老虎’。那么,这个让AI拥有‘非线性判断力’的激活函数,到底是怎么工作的?它有哪些‘性格’?。

一、从"直线思维"到"曲线思维"

还记得我们之前说的奶茶店预测模型吗?销售额 = a × 气温 + b,这就是个典型的线性模型

线性模型有个致命缺陷:它只能画直线

但现实世界哪有那么多直线关系?气温和奶茶销量的关系可能是这样的:

  • 气温20°C以下:销量平稳
  • 20°C到30°C:销量快速上升
  • 30°C以上:太热了,大家反而想喝冰水,销量下降

这种"先升后降"的曲线,你让y=ax+b怎么画?它画不出来!

这就是线性模型的局限:无论你怎么调整a和b这两个旋钮,你只能得到不同斜率和位置的直线,永远得不到一条曲线

二、激活函数:给AI装上"转弯"的能力

激活函数(Activation Function)就是解决这个问题的关键。

你可以把它想象成一个信号处理器,或者更形象地说,是一个判断官

每个神经元(就是我们之前说的"小公式")在计算完自己的线性结果后,不会直接把这个结果传给下一层,而是先交给激活函数这个"判断

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 14:21:33

QNAP QTS系统SQL注入漏洞CVE-2025-62849技术分析与缓解措施

CVE-2025-62849: QNAP Systems Inc. QTS 中的 CWE-89 漏洞 严重性: 中等 类型: 漏洞 CVE-2025-62849 据报道,一个SQL注入漏洞影响了多个QNAP操作系统版本。远程攻击者可利用此漏洞执行未授权的代码或命令。 我们已在以下版本中修复了该漏洞&a…

作者头像 李华
网站建设 2026/6/9 21:25:44

Python贪心算法

一、贪心算法核心思想贪心算法(Greedy Algorithm)是一种在每一步选择中都采取当前状态下最优或最有利的选择,从而希望导致结果是全局最优的算法策略。贪心算法的基本特征:局部最优选择:每一步都选择当前看起来最好的选…

作者头像 李华