图像分类的工作原理 - Amazon SageMaker

图像分类的工作原理

图像分类算法将图像作为输入,并将其归入输出类别之一。深度学习彻底改变了图像分类域,并且表现非常出色。各种深度学习网络(例如 ResNetDenseNetInception)的开发均旨在实现高度准确的图像分类。与此同时,我们一直在努力收集对训练这些网络非常必要的标签图像数据。ImageNet 便是这样一种大型数据集,它拥有大约 11000 种类别和超过 1100 万张图像。一旦使用 ImageNet 数据训练网络,该网络便可用于通过其他数据集以及通过简单的重新调整或优化进行泛化。在这种迁移学习方法中,网络通过权重进行初始化(对于本例,在 ImageNet 上进行训练),稍后可针对不同数据集中的图像分类任务进行优化。

Amazon SageMaker 中的图像分类可在两种模式下运行:完整训练和迁移学习。在完整训练模式下,网络使用随机权重进行初始化,并从头开始根据用户数据进行训练。在迁移学习模式下,网络使用预先训练的权重进行初始化,并且只有顶部完全连接的层使用随机权重进行初始化。然后,使用新数据对整个网络进行微调。在此模式下,甚至可以使用较小数据集实现训练。这是因为网络已经过训练,因此可在训练数据不足的情况下使用。