news 2026/6/10 0:35:13

CNN基础学习

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CNN基础学习

现在感觉,神经网络模型成为了基本单元,或者原理图的元器件,或者积木的基本块,然后人们设计出各种类型的积木块(自己想怎么设计就怎么设计),用这些积木进行搭建,CNN呀,RNN,transformer等诞生了。

CNN 的英文全称是 Convolutional Neural Network,中文译为卷积神经网络。

CNN分成卷积层、池化层和全连接层。
卷积层:特征提取。
池化层:降维。
全连接层:输出结果。

1.组成

1.1 卷积层

功能:网络的核心,用于特征提取。
关键概念:卷积核/滤波器:一个小的权重矩阵(如3x3, 5x5)。以前把filter翻译为滤波器,现在都是翻译成卷积核。

它在输入上滑动,计算局部点积,生成特征图。一个卷积层可以有多个不同的卷积核,每个负责提取一种特征。
特征图:卷积核在输入上滑动计算后得到的输出。它反映了原图中某种特征(如垂直边缘)的分布。
步长:卷积核每次移动的像素数。步长大,输出尺寸小。

填充:在输入图像边缘补零。目的是控制输出特征图的尺寸,防止过快缩小。还有一点原因是如果不填充,通过卷积核扫描计算,它边界(上下左右)的元素被扫描的少,信息就有确实,所以就填充(padding)。注意,填充是一圈一圈的填充。

1.2 激活函数层

功能:引入非线性,使网络能够学习复杂的模式。
常用函数:ReLU。它将所有负值置零,保留正值。计算简单,能有效缓解梯度消失问题。

1.3 池化层

功能:进行空间下采样,减少参数和计算量,并增强特征的空间不变性。
常用类型:
最大池化:取窗口内的最大值。最常用,能保留最显著的特征。平均池化:取窗口内的平均值。特点:池化操作是确定性的,没有需要学习的参数。

1.4 全连接层

功能:通常出现在网络的最后几层。
它将前面卷积和池化层提取到的、在空间上展开的二维高级特征“拉直”成一维向量,并进行综合,用于最终的分类或回归输出。

注意:在现代架构(如ResNet)中,常用“全局平均池化”替代一部分全连接层,以减少过拟合。

2.超参数

卷积核超参数:步长,大小。
一个卷积核的通道数由输入的通道数决定。比如卷积核我们设置大小为mxn,输入通道为3,那么一个卷积核就是mxnx3。注意:一个卷积核生成一个特征图——啥意思呢?就比如输入3个通道,那3个通道各个通道对应一个卷积计算,做卷积计算时会有3个结果(每个通道一个),然后3个卷积结果相加就是对应特征图的一个元素。

填充几圈数。
输入通道数,
网络层数,
激活函数,
学习率,
等等。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 19:41:39

StructBERT实战:产品评价情感分析系统搭建

StructBERT实战:产品评价情感分析系统搭建 1. 中文情感分析的应用价值与挑战 在电商、社交平台和用户反馈系统中,中文情感分析已成为理解用户情绪、优化产品服务的关键技术。随着消费者每天产生海量的评论数据——从“这个手机拍照真清晰”到“物流太慢…

作者头像 李华
网站建设 2026/6/10 13:09:08

GTE中文语义相似度服务优化技巧:提升计算速度的秘籍

GTE中文语义相似度服务优化技巧:提升计算速度的秘籍 1. 引言:GTE 中文语义相似度服务的价值与挑战 随着自然语言处理技术在智能客服、内容推荐和信息检索等场景中的广泛应用,语义相似度计算已成为核心能力之一。传统的关键词匹配方法难以捕…

作者头像 李华
网站建设 2026/6/10 13:18:33

新型量子芯片架构:可重构路由器实现全连接

重新构想量子芯片 某大学的研究人员实现了一种新的超导量子处理器设计,旨在为量子革命所需的大规模、耐用设备提供一种潜在的架构。 与传统将信息处理量子比特布置在二维网格上的典型量子芯片设计不同,该团队设计了一种模块化量子处理器,其核…

作者头像 李华
网站建设 2026/6/10 15:21:20

AI智能实体侦测新手指南:5分钟部署第一个检测模型

AI智能实体侦测新手指南:5分钟部署第一个检测模型 引言:从理论到实践的最后一公里 很多对AI安全感兴趣的朋友都有类似的经历:看了三个月机器学习教材,好不容易找到一个开源项目想练手,却被Docker配置、CUDA驱动这些&…

作者头像 李华
网站建设 2026/6/10 13:31:59

中文情感分析API开发:StructBERT保姆级教程

中文情感分析API开发:StructBERT保姆级教程 1. 引言:中文情感分析的现实需求 在当今数字化时代,用户生成内容(UGC)呈爆炸式增长,社交媒体、电商平台、客服系统每天产生海量中文文本。如何从中快速识别用户…

作者头像 李华
网站建设 2026/6/10 15:34:28

AI智能实体侦测效果可视化:3D攻击图谱,云端实时渲染

AI智能实体侦测效果可视化:3D攻击图谱,云端实时渲染 引言:当安全演示遇上3D可视化 想象一下这样的场景:你正在向客户演示网络安全防护方案,屏幕上却只能展示枯燥的表格数据和静态图表。客户的眼神逐渐游离&#xff0…

作者头像 李华