经典卷积神经网络——VGGNet

本文内容同个人微信号推送文章:经典卷积神经网络(Classic Convolutional Neural Networks)

VGGNet(2014)

VGGNet是牛津大学计算机视觉组(University of Oxford)和Google DeepMind与204年提出的卷积神经网络。VGGNet通过反复的堆叠33的小型卷积核和22的最大池化层,构建了16-19层深的卷积神经网络。其取得了ILSVRC 2014比赛分类项目的第2名和定位项目的第1名。

VGGNet的网络结构

VGGNet的网络结构图如下图所示:

特点1:The Use of 1×1 and 3×3 Filters(Reduce the number of parameters)

两个3×3卷积核叠加,相当于一个5×5的卷积核的覆盖范围。但是训练的参数减少了。

By using 2 layers of 3×3 filters, it actually have already covered 5×5 area as in the above figure.
| filters | number of parameters |
| ———— | ———— |
|1 layer of 5*5 filter |5*5=25 |
|2 layers of 3*3 filter | 3*3+3*3=18 |
可以看到,一个5×5的卷积核需要训练25个参数,而2层3×3的卷积核需要训练的参数为18个。训练的参数减少,可以加快模型的训练速度,同时避免模型的过拟合。

特点2:引入1*1的卷积核

VGGNet的卷积结构中,引入了1*1的卷积核,不影响输入输出维度的情况下,引入非线性变化。增强的网络表达能力,降低计算量。

特点3:Data Augmentation(Multi-Scale)

通过随机将图像裁剪成224224尺寸;或者将图片缩放成256×256、284384尺寸,实现数据的增强。使得模型更加准确。

特点4:先训练简单的网络,再训练复杂的网络

在训练的时候,可以先训练简单的(层数较少)的VGGNet的A级网络,然后使用A网络的权重初始化后面的复杂模型,加快模型的收敛速度。

0

Leave a Reply

Your email address will not be published.