卷积操作的核心思想
卷积操作通过滤波器在图像上滑动,提取局部特征。公式:y(i,j) = Σ Σ x(i+m,j+n)·w(m,n),w是滤波器权重。
关键特性:局部连接、权重共享、空间结构保持。大幅减少参数量,捕捉空间模式。
CNN的经典架构
架构演进
- LeNet:早期CNN,手写数字识别
- AlexNet:深度学习突破,ImageNet冠军
- VGG:深层小卷积核,简化设计
- ResNet:残差连接,突破深度限制
池化层的作用
池化降低空间维度,增强特征不变性。最大池化保留显著特征,平均池化保留整体信息。
现代CNN创新
残差连接(ResNet)解决深层网络训练难题;批归一化稳定训练过程;深度可分离卷积(MobileNet)提高效率。
设计要点
卷积层提取特征,池化层降低维度,全连接层完成分类。深度与效率需平衡考量。
CNN让神经网络看见世界,图像识别从此进入深度学习时代。