VGGNET是由牛津大学和Google DeepMind的计算机视觉组合开发的深卷积神经网络开发的。它探索了卷积神经网络及其性能的深度。通过重复堆叠33个小型卷积内核和22的最大合并层,成功构建了16-19的卷积神经网络深度。。VGGNET网络结构清晰而简单。尽管它已经发布了多年,但仍有非常广泛使用的应用程序。
VGGNET有两种类型:VGG16和VGG19。
VGG16具有13个完整的连接层,其中有13个核容积层(3、3)和5个最大池层。VGG16具有一个合规层,具有16个核心(3、3)和3个完整连接层,配以5个最大池层。
下表屏幕截图来自VGGNET纸。我们关注D和E两列。
它们分别对应于VGG16和VGG19的两个模型。
VGGNET的所有卷积层都是(3,3)。由于连续3组(3,3)卷积内核,其作用与(7,7)的卷积核效应相同。
一个(7,7)卷积核心,参数数为7 x 7 = 49。
连续3组(3,3)的卷积核参数的数量为3 x 3 x 3 = 27。
减少参数的数量并加快训练。
接下来运行的VGG16和VGG19的网络模型使用此数据集。
CIFAR-10数据集由32 * 32的60,000个颜色图片组成,共有10个类别,每个分类为6,000张图片。在它们中,有50,000张培训集,并测试了10,000张图片。
数据集包含10个类别,例如飞机,手机:
该代码已被调试并可以运行,最终准确率约为88%。
vggnet论文