Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Requisitos y prácticas recomendadas para crear productos de machine learning
Es importante que a sus compradores les resulte fácil probar sus productos de paquete de modelos y algoritmos. En las siguientes secciones se describen los requisitos para crear listados de productos de machine learning (ML) y las prácticas recomendadas para los mismos. Para ver un resumen completo de los requisitos y recomendaciones, consulte Resumen de los requisitos y recomendaciones para los listados de productos de ML.
nota
Un AWS Marketplace representante podría ponerse en contacto contigo para ayudarte a cumplir estos requisitos si los productos publicados no los cumplen.
Temas
Activos necesarios
Antes de crear un listado de productos de machine learning, asegúrese de contar con los siguientes recursos necesarios:
-
Nombre del recurso de Amazon (ARN): proporcione el paquete ARN de modelos o el recurso de algoritmo desde el Región de AWS que va a publicar (consulteCompatible con Regiones de AWS la publicación).
-
En ARN el caso de un paquete modelo, tiene este formulario:
arn:aws:sagemaker:<region>:<account-id>:model-package/<model-package-name>
-
Un algoritmo ARN para un algoritmo tiene esta forma:
arn:aws:sagemaker:<region>:<account-id>:algorithm/<algorithm-name>
-
-
Requisitos de información de uso: proporcione detalles sobre las entradas, las salidas y los ejemplos de código.
-
Requisitos de entradas y salidas: proporcione archivos o texto.
-
Requisitos para el cuaderno de Jupyter: demuestre el uso completo del producto.
Prácticas recomendadas generales para productos de ML
Proporcione la siguiente información para su producto de machine learning:
-
Para las descripciones de los productos, incluya lo siguiente:
-
Qué hace su modelo
-
Quién es el cliente de destino
-
Cuál es el caso de uso más importante
-
Cómo se entrenó su modelo o la cantidad de datos que se usaron
-
Cuáles son las métricas de rendimiento y los datos de validación utilizados
-
Si es médico, si su modelo es o no para uso diagnóstico
-
-
De forma predeterminada, los productos de machine learning están configurados para tener visibilidad pública. Sin embargo, puede crear un producto con visibilidad privada. Para obtener más información, consulte Crear listado de productos.
-
(Opcional) En el caso de los productos de pago, ofrezca una prueba gratuita de 14 a 30 días para que los clientes prueben su producto. Para obtener más información, consulte Precios de productos de aprendizaje automático para AWS Marketplace.
-
(Opcional) En el caso de los productos de paquetes de modelos, si quiere activar una demostración del producto en tiempo real en la página de su listado de productos, póngase en contacto con el equipo de operaciones de vendedor de AWS Marketplace
. La demostración del producto permite a un posible comprador probar su modelo directamente en la página del listado sin necesidad de suscribirse al modelo ni de implementarlo por sí mismo.
Requisitos de información de uso
Una información de uso clara que describa las entradas y salidas esperadas del producto (con ejemplos) es fundamental para que el comprador disfrute de una experiencia positiva.
Con cada nueva versión de su recurso que añada a su listado de productos, debe proporcionar información de uso.
Para añadir información de uso de un producto nuevo que va a publicar por primera vez, inicie sesión en la AWS Marketplace Management Portal consola. En el menú desplegable Productos, seleccione Machine learning. Seleccione el producto. En la opción de lanzamiento de la descripción general del producto, proporciona el paquete ARN de tu modelo o recurso de algoritmo y selecciona Añadir.
Para editar la información de uso existente de una versión específica, seleccione Editar en Opción de lanzamiento y, a continuación, seleccione Editar versión.
Requisitos de entradas y salidas
Para ayudar a los compradores a entender y utilizar el producto, es importante una explicación clara del formato, con ejemplos de entradas y salidas. Esta comprensión ayuda a los compradores a realizar las transformaciones necesarias en los datos de entrada para obtener los mejores resultados de inferencia.
Se te solicitará lo siguiente cuando agregues tu SageMaker recurso de Amazon a tu lista de productos.
Entradas y salidas de inferencia
Para la entrada de inferencias, proporcione el formato de entrada tanto para el punto de conexión en tiempo real como para el trabajo de transformación por lotes. Incluya fragmentos de código para cualquier procesamiento previo de los datos que sea necesario. Incluye los tipos de MIME contenido compatibles (por ejemplo, image/jpeg, image/png, image/bmp), descripciones de los valores, si corresponde, y limitaciones. Incluya GitHub
Para el resultado de la inferencia, proporcione el formato de salida tanto para el punto de conexión en tiempo real como para el trabajo de transformación por lotes. Incluya el tipo de MIME contenido de salida (por ejemplo, application/json, image/jpeg) y la descripción de los valores, si corresponde. Incluya las muestras de salida alojadas en. GitHub
En el caso de los ejemplos, proporcione archivos de entrada que funcionen con su producto. Si su modelo realiza una clasificación multiclase, debe proporcionar al menos un archivo de entrada de muestra para cada una de las clases.
Entradas de formación
En la sección Información para entrenar un modelo, proporcione el formato de los datos de entrada y los fragmentos de código para cualquier procesamiento previo de los datos que sea necesario. Incluya los tipos de MIME contenido compatibles (por ejemplo, image/jpeg, image/png, image/bmp), la descripción de los valores, si corresponde, y las limitaciones. Asegúrese de incluir las muestras de entrada alojadas en. GitHub
Explique las funciones opcionales y obligatorias que puede proporcionar el comprador y especifique si se admite el modo de entrada PIPE
. Si se admite la formación distribuida (formación con más de CPU 1 GPU instancia o instancia), especifíquela. Para ajustar, indique los hiperparámetros recomendados.
Requisitos para el cuaderno de Jupyter
Cuando añadas tu SageMaker recurso a tu catálogo de productos, proporciona un enlace a un ejemplo de bloc de notas de Jupyter en el GitHub
Utilice la AWS SDK for Python (Boto). Un cuaderno de muestra bien desarrollado facilita que los compradores prueben y usen su listado.
En el caso de los productos de paquetes de modelos, su cuaderno de muestra indica cómo se preparan los datos de entrada, se crea un punto de conexión para realizar inferencias en tiempo real y se realizan los trabajos de transformación por lotes. Para obtener más información, consulte la lista de Model Package y el cuaderno de muestra
nota
Un ejemplo de cuaderno de Jupyter poco desarrollado y que no muestre las múltiples entradas posibles y los pasos de preprocesamiento de los datos podría dificultar que el comprador comprenda completamente la propuesta de valor del producto.
En el caso de los productos algorítmicos, el cuaderno de muestra muestra una formación completa, el ajuste, la creación de modelos, la creación de un punto final para la inferencia en tiempo real y la ejecución de los trabajos de transformación por lotes. Para obtener más información, consulte la lista de algoritmos y el cuaderno de muestra
nota
La falta de datos de entrenamiento de muestra puede impedir que su comprador ejecute con éxito el cuaderno de Jupyter. Un cuaderno de muestra poco desarrollado podría impedir que los compradores usen su producto y dificultar su adopción.
Resumen de los requisitos y recomendaciones para los listados de productos de ML
En la siguiente tabla se proporciona un resumen de los requisitos y recomendaciones para una página de listado de productos de machine learning.
Detalles | Para listados de paquetes de modelos | Para listados de algoritmos |
---|---|---|
Product descriptions | ||
Explica en detalle qué hace el producto con los tipos de contenido compatibles (por ejemplo, «detecta X en las imágenes»). | Obligatoria | Obligatoria |
Proporciona información convincente y diferenciadora sobre el producto (evita adjetivos como «el mejor» o afirmaciones sin fundamento). | Recomendado | Recomendado |
Enumere los casos de uso más importantes de este producto. | Obligatoria | Obligatoria |
Describa los datos (fuente y tamaño) con los que se entrenó y enumere las limitaciones conocidas. | Obligatoria | No aplicable |
Describa el marco básico sobre el que se creó el modelo. | Recomendado | Recomendado |
Resuma la métrica de rendimiento del modelo a partir de los datos de validación (por ejemplo, «un XX y un porcentaje de precisión comparado con el conjunto de datos Z»). | Obligatoria | No aplicable |
Resuma las métricas de rendimiento o latencia del modelo según el tipo de instancia recomendado. | Obligatoria | No aplicable |
Describa la categoría del algoritmo. Por ejemplo, «Este algoritmo de regresión de bosques de decisiones se basa en un conjunto de clasificadores con estructura de árbol que se crean mediante la técnica general de agregación inicial y una selección aleatoria de características». | No aplicable | Obligatoria |
Usage information | ||
A modo de inferencia, proporcione el formato de entrada tanto para el punto final en tiempo real como para el trabajo de transformación por lotes. Incluya los tipos de MIME contenido compatibles (por ejemplo, image/jpeg, image/png, image/bmp), la descripción de los valores, si corresponde, y las limitaciones. Consulte Requisitos de entradas y salidas. | Obligatoria | Obligatoria |
A modo de inferencia, proporcione muestras de entrada tanto para el trabajo de transformación por lotes como para el punto final en tiempo real. Las muestras deben estar alojadas en. GitHub Consulte Requisitos de entradas y salidas. | Obligatoria | Obligatoria |
A modo de inferencia, proporcione el formato de salida tanto para el punto final en tiempo real como para el trabajo de transformación por lotes. Incluya el tipo de MIME contenido de salida (por ejemplo, application/json, image/jpeg) y la descripción de los valores, si corresponde. Consulte Requisitos de entradas y salidas. | Obligatoria | Obligatoria |
A modo de inferencia, proporcione muestras de salida tanto para el trabajo de punto final en tiempo real como para el trabajo de transformación por lotes. Las muestras deben estar alojadas en. GitHub Consulte Requisitos de entradas y salidas. | Obligatoria | Obligatoria |
A modo de inferencia, proporcione un ejemplo del uso de un trabajo de transformación por lotes o de punto final. Incluya un ejemplo de código con los comandos AWS Command Line Interface (AWS CLI) o con un AWS SDK. | Obligatoria | Obligatoria |
Para la formación, proporcione un formato de entrada. Incluye los tipos de MIME contenido compatibles (por ejemplo, image/jpeg, image/png, image/bmp), la descripción de los valores, si corresponde, y las limitaciones (por ejemplo, el número mínimo de filas de datos obligatorio). Consulte Requisitos de entradas y salidas. | No aplicable | Obligatoria |
Para la formación, proporciona muestras de entrada alojadas en. GitHub Consulte Requisitos de entradas y salidas. | No aplicable | Obligatoria |
Para la formación, proporcione un ejemplo de cómo realizar trabajos de formación. Describa los hiperparámetros admitidos, sus rangos y su impacto general. Especifique si el algoritmo admite el ajuste de hiperparámetros, el entrenamiento distribuido o GPU las instancias. Incluya ejemplos de código, como AWS CLI comandos, o utilice un AWS SDK, por ejemplo. | No aplicable | Obligatoria |
Proporcione un cuaderno de Jupyter GitHub que muestre el uso completo de su producto. Consulte Requisitos para el cuaderno de Jupyter. | Obligatoria | Obligatoria |
Proporcione información técnica relacionada con el uso del producto, incluidos los manuales de usuario y los datos de muestra. | Recomendado | Recomendado |