实践篇VGG的网络架构-动手实现手写数字的识别

发布网友发布时间：3小时前

共1个回答

热心网友时间：1小时前

VGG的网络架构可以看作是加深版的AlexNet，主要由卷积层和全连接层组成。与AlexNet不同的是，VGG使用的是3×3的小尺寸卷积核。其网络架构通过不断加深网络来提升性能，通过重复使用简单的基础块构建深度模型。在实现VGG模型时，首先实现VGG块，其组成规律是连续使用多个填充为1、卷积核大小为3×3的卷积层后接上一个步幅为2、窗口形状为2×2的最大池化层。在tf.keras中，通过vgg_block函数来实现这个基础的VGG块，可以指定卷积层的数量和每层的卷积核个数。VGG16网络有5个卷积块，前2块使用两个卷积层，而后3块使用三个卷积层。第一块的输出通道数为，之后每次翻倍，直到变为512。

在手写数字识别中，我们使用MNIST数据集来演示VGGNet。读取数据时将图像高和宽扩大到VggNet使用的图像高和宽224。首先获取数据并进行维度调整。由于使用全部数据训练时间较长，定义了两个方法获取部分数据，并将图像调整为224*224大小，进行模型训练。调用上述方法获取参与模型训练和测试的数据集。然后构造模型进行训练和评估。

在模型训练过程中，输出了训练结果。在模型评估阶段，输出了评估结果。如果使用整个数据集训练网络并评估，结果将有所不同。为了让大家更好地理解，提供了数据展示结果。

全部栏目

实践篇VGG的网络架构-动手实现手写数字的识别