本周核心定位
学习 RNN 改进模型 LSTM、GRU,解决长依赖问题;完整落地文本情感分类项目;串联图像分类 + 文本分类两大项目,完成阶段考核验收。
一、本周知识点(每日拆分建议)
- Day1 LSTM 长短期记忆网络
- LSTM 设计初衷:解决 RNN 长序列梯度消失
- 四大门控结构:遗忘门、输入门、细胞状态、输出门作用与流转逻辑
- LSTM 单元整体运算流程
- Day2 GRU 门控循环单元
- GRU 相比 LSTM 的简化设计(合并门控、参数量更少、训练更快)
- 更新门、重置门工作原理
- LSTM 与 GRU 优缺点、选型场景对比
- Day3 序列模型工程要点
- 多层 RNN/LSTM/GRU 堆叠、dropout 正则化在序列网络中的使用
- 双向循环网络(Bi-RNN/Bi-LSTM)适用场景(文本特征提取)
- 序列模型训练调参基础:学习率、批次大小、序列长度设置
二、本周实操任务(核心:文本情感分类完整项目)
数据集选用:公开英文 / 中文情感数据集(如 IMDB 影评、中文微博情感数据集)
- Day4 完整项目开发(上)
- 整合第 23 周预处理代码,搭建Embedding + LSTM/GRU + 全连接分类头完整网络
- 划分训练集 / 测试集,定义损失函数、优化器、评价指标(准确率)
- Day5 完整项目开发(下)
- 编写训练、验证、测试全套代码,运行模型完成训练
- 模型效果调优:调整网络层数、隐藏层维度、词表大小,观察准确率变化
- 单条文本推理测试:输入自定义语句,验证情感分类结果
三、本周阶段验收(必完成,本阶段最终考核)
验收要求:独立完成图像分类、文本分类两大 PyTorch 深度学习项目
- 项目 1(历史复盘):PyTorch 图像分类项目
- 可复现代码,能清晰讲解 CNN 网络结构、数据加载、训练流程、结果分析
- 项目 2(本周新作):PyTorch 文本情感分类项目
- 独立编写完整可运行代码(预处理 + Embedding+LSTM/GRU + 分类 + 训练推理)
- 能讲解:序列数据处理流程、LSTM/GRU 作用、网络设计思路、模型效果
- 综合考核:
- 口头 / 文档说明:CNN 与循环网络的区别、各自适用任务
- 代码实操:现场修改网络结构(如替换 RNN 为 LSTM、调整隐藏层节点)并重新运行
四、本周最终产出
- 笔记:LSTM、GRU 门控原理、两类模型对比总结
- 全套代码:
- 图像分类完整项目代码(归档整理)
- 文本情感分类完整项目代码(含预处理、训练、推理)
- 项目报告(可选,按课程要求):两个项目的思路、网络结构、实验结果、问题总结
补充:两周整体学习节奏 & 重点总结
- 理论主线23 周:认识序列数据 → 原生 RNN → RNN 缺陷24 周:LSTM(复杂版改进)→ GRU(轻量版改进)→ 工程调优
- 实操主线23 周:文本预处理 + 基础 RNN 搭建(练数据、练基础网络)24 周:LSTM/GRU 完整情感分类项目 + 双项目整合验收
- 核心能力达成
- 理解循环网络时序依赖的核心思想
- 熟练
nn.Embedding、nn.RNN、nn.LSTM、nn.GRU等 PyTorch 层用法 - 具备独立搭建 ** 图像分类(CNN)、文本分类(RNN 系列)** 两大经典深度学习项目的能力