Cómo funciona la detección de objetos

El algoritmo de detección de objetos identifica y localiza todas las instancias de objetos en una imagen de un conjunto de categorías de objetos. El algoritmo toma una imagen como entrada y genera la categoría a la que pertenece el objeto, junto con una puntuación de confianza que pertenece a la categoría. El algoritmo también predice la ubicación y escala de cada objeto con un cuadro delimitador rectangular. Amazon SageMaker Object Detection utiliza el algoritmo Single Shot Multibox Detector (SSD) que toma como red base una red neuronal convolucional (CNN) previamente entrenada para tareas de clasificación. SSD utiliza la salida de capas intermedias como características para la detección.

Varias CNN, como VGG, ResNethan obtenido un gran rendimiento en la tarea de clasificación de imágenes. La detección de objetos en Amazon SageMaker es compatible con VGG-16 y ResNet -50 como red base para SSD. El algoritmo puede ser capacitado en modo de capacitación completa o en modo de aprendizaje de transferencia. En el modo de capacitación completa, la red base se inicializa con ponderaciones aleatorias y después se capacita con los datos de usuario. En el modo de aprendizaje de transferencia, las ponderaciones de la red base se cargan desde modelos capacitados previamente.

El algoritmo de detección de objetos utiliza operaciones de aumento de datos estándar, como, por ejemplo, flip, rescale y jittery sobre la marcha internamente para ayudar a evitar ajustes excesivos.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Detección de objetos - MXNet

Hiperparámetros