Unidades de inferencia Zonas de disponibilidad

Ejecución de un modelo de Etiquetas personalizadas de Amazon Rekognition

Si el modelo ya tiene la precisión que busca, puede empezar a utilizarlo. Puede iniciar y detener un modelo mediante la consola o el AWS SDK. La consola también incluye ejemplos de operaciones del SDK que puede utilizar.

Temas

Unidades de inferencia

Al iniciar el modelo, se indica el número de recursos de computación, conocidos como unidades de inferencia, que utiliza el modelo.

importante

Se le cobrará por el número de horas que el modelo esté en ejecución y por el número de unidades de inferencia que utilice mientras se ejecute, en función de cómo configure la ejecución del modelo. Por ejemplo, si inicia el modelo con dos unidades de inferencia y lo utiliza durante 8 horas, se le cobrarán 16 horas de inferencia (8 horas de tiempo de ejecución x dos unidades de inferencia). Para obtener más información, consulte Horas de inferencias. Si no detiene el modelo directamente, se le cobrará aunque no se analicen activamente las imágenes con el modelo.

Las transacciones por segundo (TPS) que engloba una sola unidad de inferencia se ven afectadas por lo siguiente.

Un modelo que detecta etiquetas de imagen (clasificación) generalmente tiene un TPS más alto que un modelo que detecta y localiza objetos con cuadros delimitadores (detección de objetos).
La complejidad del modelo.
Una imagen con mayor resolución exige más tiempo de análisis.
El análisis de más objetos en una imagen requiere más tiempo.
Las imágenes más pequeñas se analizan más rápido que las imágenes más grandes.
Una imagen transferida como bytes de imagen se analiza más rápido que al cargar primero la imagen en un bucket de Amazon S3 y, a continuación, habilitar un enlace a la imagen cargada. Las imágenes transferidas como bytes de imagen deben ocupar menos de 4 MB. Se recomienda utilizar los bytes de imagen para el procesamiento de imágenes prácticamente en tiempo real y cuando el tamaño de la imagen sea inferior a 4 MB. Por ejemplo, las imágenes capturadas con una cámara de vigilancia.
Si se procesan las imágenes almacenadas en un bucket de Amazon S3, el proceso será más rápido que descargarlas, convertirlas en bytes de imagen y luego transferirlas para su análisis.
Si se analiza una imagen ya almacenada en un bucket de Amazon S3, probablemente el proceso sea más rápido que analizar la misma imagen transferida como bytes de imagen. Esto es especialmente cierto si el tamaño de la imagen es superior.

Si el número de llamadas a DetectCustomLabels supera el TPS máximo admitido por el total de unidades de inferencia que utiliza un modelo, Etiquetas personalizadas de Amazon Rekognition devolverá la excepción ProvisionedThroughputExceededException.

Gestión del rendimiento con unidades de inferencia

Puede aumentar o disminuir el rendimiento del modelo en función de las exigencias de su aplicación. Para aumentar el rendimiento, utilice unidades de inferencia adicionales. Cada unidad de inferencia adicional aumenta la velocidad de procesamiento en una unidad de inferencia. Para obtener información sobre cómo calcular el número de unidades de inferencia que necesita, consulte Calcular unidades de inferencia en los modelos Etiquetas personalizadas de Amazon Rekognition y Amazon Lookout for Vision. Si desea cambiar el rendimiento permitido para su modelo, tiene dos opciones:

Cómo añadir o eliminar unidades de inferencia manualmente

Detenga el modelo y luego reinícielo con el número correspondiente de unidades de inferencia. La desventaja de este método es que el modelo no puede recibir solicitudes mientras se reinicia y no se puede utilizar para gestionar los picos de demanda. Utilice este método si su modelo tiene un rendimiento constante y en su caso podría tolerar entre 10 y 20 minutos de inactividad. Un ejemplo de ello sería si deseara realizar llamadas por lotes en su modelo utilizando un calendario semanal.

Escalado automático de unidades de inferencia

Si su modelo tiene que adaptarse a picos de demanda, Etiquetas personalizadas de Amazon Rekognition ahora puede escalar el número de unidades de inferencia que utiliza el modelo. A medida que aumenta la demanda, Etiquetas personalizadas de Amazon Rekognition agrega unidades de inferencia adicionales al modelo y las elimina cuando la demanda decrece.

Para permitir que Etiquetas personalizadas de Amazon Rekognition escale automáticamente las unidades de inferencia de un modelo, inícielo y elija el número máximo de unidades de inferencia que puede utilizar mediante el parámetro MaxInferenceUnits. Si define un número máximo de unidades de inferencia, podrá administrar los costes de ejecutar el modelo al limitar el número de unidades de inferencia disponibles. Si no indica un número máximo de unidades, Etiquetas personalizadas de Amazon Rekognition no escalará automáticamente el modelo, sino que solo utilizará el número de unidades de inferencia con las que comenzó. Para obtener información sobre el número máximo de unidades de inferencia, consulte Service Quotas.

También puede indicar un número mínimo de unidades de inferencia mediante el parámetro MinInferenceUnits. Esto le permite especificar el rendimiento mínimo del modelo, donde una sola unidad de inferencia representa 1 hora de tiempo de procesamiento.

nota

No puede definir el número máximo de unidades de inferencia en la consola de Etiquetas personalizadas de Amazon Rekognition. En su lugar, indique el parámetro de entrada MaxInferenceUnits en la operación StartProjectVersion.

Amazon Rekognition Custom Labels proporciona las siguientes métricas de CloudWatch Amazon Logs que puede utilizar para determinar el estado actual de escalado automático de un modelo.

Métrica	Descripción
`DesiredInferenceUnits`	El número de unidades de inferencia con las que Etiquetas personalizadas de Amazon Rekognition está haciendo la escala más grande o pequeña.
`InServiceInferenceUnits`	El número de unidades de inferencia que utiliza el modelo.

Si DesiredInferenceUnits = InServiceInferenceUnits, Etiquetas personalizadas de Amazon Rekognition no estará escalando el número de unidades de inferencia.

Si DesiredInferenceUnits > InServiceInferenceUnits, Etiquetas personalizadas de Amazon Rekognition aumentará la escala más grande hasta alcanzar el valor de DesiredInferenceUnits.

Si DesiredInferenceUnits > InServiceInferenceUnits, Etiquetas personalizadas de Amazon Rekognition reducirá la escala más pequeña hasta alcanzar el valor de DesiredInferenceUnits.

Para obtener más información sobre las métricas devueltas por las etiquetas personalizadas de Amazon Rekognition y las dimensiones de filtrado, CloudWatch consulte las métricas de Rekognition.

Para saber el número máximo de unidades de inferencia que ha solicitado para un modelo, llame a DescribeProjectsVersion y revise el campo MaxInferenceUnits en la respuesta. Para ver el código de ejemplo, consulte Descripción de un modelo (SDK).

Zonas de disponibilidad

Etiquetas personalizadas de Amazon Rekognition distribuye las unidades de inferencia en varias zonas de disponibilidad de una región de AWS para ofrecer una mayor disponibilidad. Para obtener más información, consulte Zonas de disponibilidad. Para proteger los modelos de producción de las interrupciones en las zonas de disponibilidad y de los errores en las unidades de inferencia, inicie los modelos de producción con al menos dos unidades de inferencia.

Si se produce una interrupción en la zona de disponibilidad, todas las unidades de inferencia de la zona de disponibilidad no estarán disponibles y la capacidad del modelo se reducirá. Las llamadas a DetectCustomLabels se redistribuyen entre las unidades de inferencia restantes. Estas llamadas se realizan correctamente si no superan las transacciones por segundo (TPS) permitidas de las unidades de inferencia restantes. Una vez que AWS repara la zona de disponibilidad, se reinician las unidades de inferencia y se restablece la capacidad total.

Si una sola unidad de inferencia falla, Etiquetas personalizadas de Amazon Rekognition iniciará automáticamente una nueva unidad de inferencia en la misma zona de disponibilidad. La capacidad del modelo se reduce hasta que se inicie la nueva unidad de inferencia.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Mejora de un modelo

Inicio de un modelo