As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Requisitos e práticas recomendadas para criar produtos de machine learning
É importante que os compradores achem fácil testar seu pacote de modelo e produtos de algoritmo. As seções a seguir descrevem os requisitos para criar listas de produtos de machine learning (ML) e as práticas recomendadas para produtos de ML. Para obter um resumo completo dos requisitos e recomendações, consulte a Resumo dos requisitos e recomendações para listagens de produtos de ML.
nota
Um AWS Marketplace representante pode entrar em contato com você para ajudá-lo a atender a esses requisitos, caso seus produtos publicados não os atendam.
Tópicos
Ativos necessários
Antes de criar uma lista de produtos de machine learning, verifique se você tem os seguintes ativos necessários:
-
Nome do recurso da Amazon (ARN) — Forneça o pacote ARN de modelo ou recurso de algoritmo no Região da AWS qual você está publicando (consulteRegiões da AWS Compatível com publicação).
-
Um pacote ARN para um modelo tem o seguinte formato:
arn:aws:sagemaker:<region>:<account-id>:model-package/<model-package-name>
-
E ARN para um algoritmo tem esta forma:
arn:aws:sagemaker:<region>:<account-id>:algorithm/<algorithm-name>
-
-
Requisitos para informações de uso: forneça detalhes sobre entradas, saídas e exemplos de código.
-
Requisitos para entradas e saídas: forneça arquivos ou texto.
-
Requisitos para caderno Jupyter: demonstre o uso completo do produto.
Práticas recomendadas gerais para produtos de ML
Forneça as seguintes informações para seu produto de machine learning:
-
Para obter descrições de produtos, inclua o seguinte:
-
O que seu modelo faz
-
Quem é o cliente-alvo
-
Qual é o caso de uso mais importante
-
Como seu modelo foi treinado ou a quantidade de dados usada
-
Quais são as métricas de desempenho e os dados de validação usados
-
Se for médico, se o modelo é ou não para uso em diagnóstico
-
-
Por padrão, os produtos de machine learning são configurados para ter visibilidade pública. No entanto, é possível criar um produto com visibilidade privada. Para obter mais informações, consulte Criação da lista de produtos.
-
(Opcional) Para produtos pagos, ofereça uma avaliação gratuita de 14 a 30 dias para que os clientes experimentem seu produto. Para obter mais informações, consulte Preços de produtos de aprendizado de máquina para AWS Marketplace.
-
(Opcional) Para produtos com pacotes de modelo, se você quiser ativar uma demonstração do produto em tempo real na página de listagem de produtos, entre em contato com a equipe de operações do vendedor do AWS Marketplace
. A demonstração do produto permite que um comprador em potencial experimente seu modelo diretamente na página da lista sem assinar ou implantar o modelo sozinho.
Requisitos para informações de uso
Informações claras de uso que descrevam as entradas e saídas esperadas do produto (com exemplos) são cruciais para promover uma experiência positiva para o comprador.
Com cada nova versão do recurso adicionada à lista de produtos, você deve fornecer informações de uso.
Para adicionar informações de uso de um novo produto que você está publicando pela primeira vez, entre no Portal de gerenciamento do AWS Marketplace console. No menu suspenso Produtos, escolha Machine learning. Selecione seu produto. Na opção Visão geral do produto, na opção Iniciar, forneça seu pacote ARN de modelo ou recurso de algoritmo e escolha Adicionar.
Para editar as informações de uso existentes para uma versão específica, escolha Editar na opção Iniciar e, em seguida, Editar versão.
Requisitos para entradas e saídas
Uma explicação clara do formato, com exemplos de entradas e saídas, é importante para ajudar os compradores a entender e usar seu produto. Esse entendimento ajuda os compradores a realizar as transformações necessárias nos dados de entrada para obter os melhores resultados de inferência.
Você será solicitado a fornecer o seguinte ao adicionar seu SageMaker recurso da Amazon à sua lista de produtos.
Entradas e saídas de inferência
Para entrada de inferência, forneça o formato de entrada para o endpoint em tempo real e o trabalho de transformação em lote. Inclua snippets de código para qualquer pré-processamento necessário dos dados. Inclua tipos de MIME conteúdo compatíveis (por exemplo, imagem/jpeg, imagem/png, imagem/bmp), descrições de valores, se aplicável, e limitações. Inclua amostras de entrada hospedadas em GitHub
Para a saída de inferência, forneça o formato de saída para o endpoint em tempo real e o trabalho de transformação em lote. Inclua o tipo de MIME conteúdo de saída (por exemplo, application/json, image/jpeg) e a descrição dos valores, se aplicável. Inclua amostras de saída hospedadas em GitHub
Para amostras, forneça arquivos de entrada que funcionem com seu produto. Se o modelo executar a classificação multiclasse, forneça pelo menos um arquivo de entrada de amostra para cada uma das classes.
Entradas de treinamento
Na seção Informações para treinar um modelo, forneça o formato dos dados de entrada e os snippets de código para qualquer pré-processamento necessário dos dados. Inclua tipos de MIME conteúdo compatíveis (por exemplo, imagem/jpeg, imagem/png, imagem/bmp), descrição dos valores, se aplicável, e limitações. Certifique-se de incluir amostras de entrada hospedadas em GitHub
Explique os recursos opcionais e obrigatórios que podem ser fornecidos pelo comprador e especifique se o modo de entrada PIPE
é compatível. Se o treinamento distribuído (treinamento com mais de CPU GPU 1/instância) for suportado, especifique isso. Para ajustar, liste os hiperparâmetros recomendados.
Requisitos para caderno Jupyter
Ao adicionar seu SageMaker recurso à sua lista de produtos, forneça um link para um exemplo de caderno Jupyter hospedado em GitHub
Use a AWS SDK for Python (Boto). Um caderno de amostra bem desenvolvido torna mais fácil para os compradores tentarem usar sua lista.
Para produtos de pacotes de modelo, o caderno de amostra demonstra a preparação dos dados de entrada, a criação de um endpoint para inferência em tempo real e o desempenho de trabalhos de transformação em lote. Para obter mais informações, consulte a lista do Model Package e o exemplo de caderno
nota
Um exemplo de caderno Jupyter subdesenvolvido que não mostra várias entradas possíveis e etapas de pré-processamento de dados pode dificultar que o comprador entenda completamente a proposta de valor do seu produto.
Para produtos de algoritmo, o caderno de amostra demonstra treinamento completo, ajuste, criação de modelos, criação de um endpoint para inferência em tempo real e desempenho de trabalhos de transformação em lote. Para obter mais informações, consulte Lista de algoritmos e Exemplo de caderno de anotações
nota
A falta de dados de treinamento de exemplo impede que o comprador execute o caderno Jupyter com êxito. Um caderno de exemplo subdesenvolvido pode impedir que os compradores usem seu produto e dificultar a adoção.
Resumo dos requisitos e recomendações para listagens de produtos de ML
A tabela a seguir fornece um resumo dos requisitos e das recomendações para uma página de listagem de produtos de machine learning.
Detalhes | Para listas de pacotes de modelo | Para listas de algoritmos |
---|---|---|
Product descriptions | ||
Explique em detalhes o que o produto faz com os tipos de conteúdo compatíveis (por exemplo, “detecta X em imagens”). | Obrigatório | Obrigatório |
Forneça informações convincentes e diferenciadoras sobre o produto (evite adjetivos como “melhor” ou afirmações infundadas). | Recomendado | Recomendado |
Liste os casos de uso mais importantes desse produto. | Obrigatório | Obrigatório |
Descreva os dados (fonte e tamanho) nos quais ele foi treinado e liste todas as limitações conhecidas. | Obrigatório | Não aplicável |
Descreva a estrutura principal na qual o modelo foi construído. | Recomendado | Recomendado |
Resuma a métrica de desempenho do modelo nos dados de validação (por exemplo, “XX.YY percentual de precisão comparada usando o conjunto de dados Z”). | Obrigatório | Não aplicável |
Resuma a latência do modelo e/ou as métricas de taxa de transferência no tipo de instância recomendado. | Obrigatório | Não aplicável |
Descreva a categoria do algoritmo. Por exemplo, “Esse algoritmo de regressão da floresta de decisão é baseado em um conjunto de classificadores estruturados em árvore que são construídos usando a técnica geral de agregação de bootstrap e uma escolha aleatória de recursos”. | Não aplicável | Obrigatório |
Usage information | ||
Para inferência, forneça o formato de entrada para o endpoint em tempo real e o trabalho de transformação em lote. Inclua tipos de MIME conteúdo compatíveis (por exemplo, imagem/jpeg, imagem/png, imagem/bmp), descrição dos valores, se aplicável, e limitações. Consulte Requisitos para entradas e saídas. | Obrigatório | Obrigatório |
Para inferência, forneça amostras de entrada para o endpoint em tempo real e o trabalho de transformação em lote. As amostras devem ser hospedadas em GitHub. Consulte Requisitos para entradas e saídas. | Obrigatório | Obrigatório |
Para inferência, forneça o formato de saída para o endpoint em tempo real e o trabalho de transformação em lote. Inclua o tipo de MIME conteúdo de saída (por exemplo, application/json, image/jpeg) e a descrição dos valores, se aplicável. Consulte Requisitos para entradas e saídas. | Obrigatório | Obrigatório |
Para inferência, forneça amostras de saída para o endpoint em tempo real e o trabalho de transformação em lote. As amostras devem ser hospedadas em GitHub. Consulte Requisitos para entradas e saídas. | Obrigatório | Obrigatório |
Para inferência, forneça um exemplo do uso de um trabalho de transformação de endpoint ou lote. Inclua um exemplo de código usando os comandos AWS Command Line Interface (AWS CLI) ou usando um AWS SDK. | Obrigatório | Obrigatório |
Para treinamento, forneça o formato de entrada. Inclua tipos de MIME conteúdo compatíveis (por exemplo, imagem/jpeg, imagem/png, imagem/bmp), descrição dos valores, se aplicável, e limitações (por exemplo, linhas mínimas de dados necessárias). Consulte Requisitos para entradas e saídas. | Não aplicável | Obrigatório |
Para treinamento, forneça amostras de entrada hospedadas em GitHub. Consulte Requisitos para entradas e saídas. | Não aplicável | Obrigatório |
Para treinamento, forneça um exemplo de execução de trabalhos de treinamento. Descreva os hiperparâmetros suportados, seus intervalos e seu impacto geral. Especifique se o algoritmo suporta ajuste de hiperparâmetros, treinamento distribuído ou GPU instâncias. Inclua exemplos de código, como AWS CLI comandos ou usando um AWS SDK, por exemplo. | Não aplicável | Obrigatório |
Forneça um notebook Jupyter hospedado para GitHub demonstrar o uso completo do seu produto. Consulte Requisitos para caderno Jupyter. | Obrigatório | Obrigatório |
Forneça informações técnicas relacionadas ao uso do produto, incluindo manuais do usuário e dados de amostra. | Recomendado | Recomendado |