En esta sección, se describen las restricciones y las cuotas de los productos de machine learning (ML) en AWS Marketplace.
Temas
- Aislamiento de red
- Tamaño de imagen
- Tamaño del almacenamiento
- Tamaño de instancia
- Tamaño de la carga útil para realizar inferencias
- Tiempo de procesamiento para la inferencia
- Service Quotas
- Inferencia asíncrona
- Inferencia sin servidor
- Entrenamiento de spot administrado
- Imágenes de Docker y Cuentas de AWS
- Publicación de paquetes de modelos a partir de algoritmos integrados o AWS Marketplace
- Regiones de AWS admitidas para la publicación
Aislamiento de red
Por motivos de seguridad, cuando un comprador se suscribe a su producto en contenedores, los contenedores de Docker se ejecutan en un entorno aislado sin conexión a Internet. Cuando cree sus contenedores, no confíe en que podrá realizar llamadas salientes a través de Internet, ya que fallarán. Las llamadas a Servicios de AWS también fallarán.
Tamaño de imagen
El tamaño de las imágenes de Docker se rige por las Service Quotas de Amazon Elastic Container Registry (Amazon ECR). El tamaño de la imagen de Docker afecta al tiempo de arranque durante los trabajos de entrenamiento, transformación por lotes y creación de puntos de conexión. Para lograr un mejor rendimiento, le recomendamos mantener un tamaño óptimo de imagen de Docker.
Tamaño del almacenamiento
Al crear un punto de conexión, Amazon SageMaker asocia un volumen de almacenamiento de Amazon Elastic Block Store (Amazon EBS) a cada instancia de computación de ML que aloje el punto de conexión. (Un punto de conexión también se conoce como inferencia en tiempo real o servicio de alojamiento de Amazon SageMaker). El tamaño del volumen de almacenamiento depende del tipo de instancia. Para obtener más información, consulte Alojamiento de volúmenes de almacenamiento de instancias en la Guía para desarrolladores de Amazon SageMaker.
Para obtener información sobre la transformación por lotes, consulte Almacenamiento en Batch Transform en la Guía para desarrolladores de Amazon SageMaker.
Tamaño de instancia
SageMaker proporciona una amplia selección de tipos de instancias optimizados para adaptarse a diferentes casos de uso de ML. Los tipos de instancias tienen distintos tipos de combinaciones de CPU, GPU, memoria y capacidad de red. Los tipos de instancias brindan la flexibilidad para elegir la combinación adecuada de recursos para crear, entrenar e implementar modelos de ML. Para obtener más información, consulte Tipos de instancias de ML en Amazon SageMaker
Tamaño de la carga útil para realizar inferencias
Para un punto de conexión, limite el tamaño máximo de los datos de entrada por invocación a 6 MB. Este valor no se puede ajustar.
Para la transformación por lotes, el tamaño máximo de los datos de entrada por cada invocación es de 100 MB. Este valor no se puede ajustar.
Tiempo de procesamiento para la inferencia
Para un punto de conexión, el tiempo máximo de procesamiento por cada invocación es de 60 segundos. Este valor no se puede ajustar.
Para la transformación por lotes, el tiempo máximo de procesamiento por cada invocación es de 60 minutos. Este valor no se puede ajustar.
Service Quotas
Para obtener más información sobre las cuotas relacionadas con el entrenamiento y la inferencia, consulte Cuotas de servicio de Amazon SageMaker.
Inferencia asíncrona
Los paquetes de modelos y los algoritmos publicados en AWS Marketplace no se pueden implementar en los puntos de conexión configurados para la inferencia asíncrona de Amazon SageMaker. Para los puntos de conexión configurados para la inferencia asíncrona, los modelos deben tener conectividad de red. Todos los modelos de AWS Marketplace funcionan en aislamiento de red. Para obtener más información, consulte Sin acceso a la red.
Inferencia sin servidor
Los paquetes de modelos y los algoritmos publicados en AWS Marketplace no se pueden implementar en los puntos de conexión configurados para la inferencia sin servidor de Amazon SageMaker. Para los puntos de conexión configurados para la inferencia sin servidor, los modelos deben tener conectividad de red. Todos los modelos de AWS Marketplace funcionan en aislamiento de red. Para obtener más información, consulte Sin acceso a la red.
Entrenamiento de spot administrado
Para todos los algoritmos de AWS Marketplace, el valor de MaxWaitTimeInSeconds
se establece en 3600 segundos (60 minutos), incluso si se implementa el punto de control para el entrenamiento de spot administrado. Este valor no se puede ajustar.
Imágenes de Docker y Cuentas de AWS
Para su publicación, las imágenes deben almacenarse en los repositorios de Amazon ECR propiedad de la Cuenta de AWS del vendedor. No es posible publicar imágenes que estén almacenadas en un repositorio que sea propiedad de otra Cuenta de AWS.
Publicación de paquetes de modelos a partir de algoritmos integrados o AWS Marketplace
No se pueden publicar los paquetes de modelos creados a partir de trabajos de entrenamiento mediante un algoritmo integrado de Amazon SageMaker o un algoritmo de una suscripción de AWS Marketplace.
Puede seguir utilizando los artefactos del modelo del trabajo de entrenamiento, pero necesitará su propia imagen de inferencia para publicar paquetes de modelos.
Regiones de AWS admitidas para la publicación
AWS Marketplace admite la publicación de recursos de algoritmos y paquetes de modelos a partir de Regiones de AWS en las que se cumpla lo siguiente:
-
Una región compatible que Amazon SageMaker admita
-
Una región disponible
inscrita de forma predeterminada (por ejemplo, describe-regions devuelve "OptInStatus": "opt-in-not-required"
)
Todos los activos necesarios para publicar un paquete de modelos o un producto de algoritmo deben almacenarse en la misma región desde la que haya decidido publicar. Esta incluye lo siguiente:
-
Recursos de algoritmos y paquetes de modelos que se crean en Amazon SageMaker
-
Imágenes de inferencia y entrenamiento que se cargan en los repositorios de Amazon ECR
-
Artefactos de modelos (si los hay) que se almacenan en Amazon Simple Storage Service (Amazon S3) y se cargan dinámicamente durante la implementación de modelos para los recursos de paquetes de modelos
-
Datos de prueba para la validación de inferencias y entrenamiento que se almacenan en Amazon S3
Puede desarrollar y entrenar su producto en cualquier región que SageMaker admita. Sin embargo, antes de poder publicar, debe copiar todos los activos y volver a crear los recursos en una región desde la que AWS Marketplace admita publicar.
Durante el proceso de publicación, independientemente de la Región de AWS desde la que publique, puede elegir las regiones en las que desee publicar y en las que quiera que el producto esté disponible.