news 2026/6/10 19:23:55

day42

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
day42

1. 过拟合的判断
过拟合是模型 “记住” 训练数据但泛化能力差的现象,核心判断方式是同步打印训练集和测试集的指标:
正常情况:训练集、测试集的损失(Loss)同步下降,准确率(或其他指标)同步上升;
过拟合情况:训练集损失持续下降、准确率持续上升,但测试集损失停止下降甚至上升、准确率停止提升。
2. 模型的保存和加载
PyTorch 中模型保存 / 加载有 3 种常见方式:
a. 仅保存权重(最常用)
保存:仅保存模型的参数(state_dict),文件小、灵活;

加载:需先初始化模型结构,再加载权重;

b. 保存权重和模型
保存:直接保存整个模型对象(包含结构 + 权重)

加载:直接加载模型

c. 保存全部信息(checkpoint)
保存:包含模型权重、优化器状态、训练轮数、损失等训练状态,支持 “断点续训”

加载:恢复模型 + 优化器状态,继续训练

3. 早停策略
早停是防止过拟合的常用方法:当测试集损失连续 N 轮不再下降时,提前停止训练。
核心逻辑:
记录当前最优测试集损失;
每轮训练后对比新的测试集损失;
若连续patience轮损失未下降,则停止训练。

作业:

@浙大疏锦行

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 3:45:53

iOS免越狱定制终极指南:从原理到实践的完整教程

iOS免越狱定制终极指南:从原理到实践的完整教程 【免费下载链接】CowabungaLite iOS 15 Customization Toolbox 项目地址: https://gitcode.com/gh_mirrors/co/CowabungaLite 在传统iOS系统定制需要越狱操作的时代,一种全新的技术路径正在悄然改变…

作者头像 李华
网站建设 2026/6/10 11:02:11

Joy-Con Toolkit深度解析:5大实用功能助你完全掌控手柄性能

Joy-Con Toolkit深度解析:5大实用功能助你完全掌控手柄性能 【免费下载链接】jc_toolkit Joy-Con Toolkit 项目地址: https://gitcode.com/gh_mirrors/jc/jc_toolkit Joy-Con Toolkit是一款专为任天堂Switch手柄设计的开源控制工具,通过强大的自定…

作者头像 李华
网站建设 2026/6/10 10:57:46

Qwen3-VL视觉编码增强:从图像直接生成Draw.io图表

Qwen3-VL视觉编码增强:从图像直接生成Draw.io图表 在一张手绘流程图被手机拍下后的几秒钟内,它就变成了一个可在Draw.io中自由拖拽、编辑和分享的矢量图表——这不再是科幻场景,而是Qwen3-VL正在实现的技术现实。当AI不仅能“看懂”图像&…

作者头像 李华
网站建设 2026/6/9 17:36:59

WarcraftHelper完全配置指南:告别魔兽争霸III的种种限制

WarcraftHelper完全配置指南:告别魔兽争霸III的种种限制 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 还在为魔兽争霸III在现代设备上的…

作者头像 李华
网站建设 2026/6/10 10:54:06

RimSort终极指南:解决ModsConfig.xml数据处理问题

RimSort作为RimWorld模组管理的强力工具,在提升游戏体验方面发挥着关键作用。然而,近期用户反馈中频繁出现ModsConfig.xml文件处理异常的问题,导致模组配置丢失和游戏启动异常。本文将从技术角度深度解析这一问题的根源,并提供完整…

作者头像 李华
网站建设 2026/6/10 10:55:36

药品管理系统信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】

摘要 随着医疗行业的快速发展,药品管理系统的信息化需求日益增长。传统的人工管理方式存在效率低下、数据易丢失、查询困难等问题,难以满足现代医疗机构的高效运营需求。药品管理系统信息管理系统的开发旨在解决这些问题,通过数字化手段实现对…

作者头像 李华