7.2 学习范式的分类:监督、无监督、半监督、自监督与强化学习
机器学习并非一个单一的方法论,而是根据学习过程中可利用的信息类型和目标形式,分化出的多种学习范式。每种范式对应着不同的数据假设、问题定义和算法体系。清晰地理解这些范式的区别与联系,是选择适当方法解决实际问题的前提。本节将系统阐述监督学习、无监督学习、半监督学习、自监督学习及强化学习这五大核心范式的定义、形式化描述、典型任务与算法。
7.2.1 监督学习
监督学习是研究最为广泛、应用最为成熟的范式。其核心特征在于,学习算法能够访问一组输入-输出对(即标注数据),目标是学习一个从输入到输出的映射函数。
7.2.1.1 问题形式化
给定一个由mmm个独立同分布样本组成的训练集D={ (x1,y1),(x2,y2),...,(xm,ym)}D = \{(\mathbf{x}_1, y_1), (\mathbf{x}_2, y_2), ..., (\mathbf{x}_m, y_m)\}D={(x1,y1),(x2,y2),...,(xm,ym)},其中xi∈X\mathbf{x}_i \in \mathcal{X}xi∈X是输入特征向量,yi∈Yy_i \in \mathcal{Y}yi∈Y是对应的标签(或称目标值)。监督学习的目标是从假设空间H\mathcal{H}H中找到一个函数h:X→Yh: \mathcal{X} \rightarrow \mathcal{Y}h:X→Y,使得该函数能够对新的输入x\mathbf{x}x预测出尽可能准确的输出yyy。
这通常通过最小化经验风险来实现:
h∗=argminh∈H1m∑i=1mL(yi,h(xi)) h^* = \arg\min_{h \in \mathcal{H}} \frac{1}{m} \sum_{i=1}^{m} L(y_i, h(\mathbf{x}_i))h∗=arg