Requisitos e práticas recomendadas para criar produtos de machine learning - AWS Marketplace

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Requisitos e práticas recomendadas para criar produtos de machine learning

É importante que os compradores achem fácil testar seu pacote de modelo e produtos de algoritmo. As seções a seguir descrevem os requisitos para criar listas de produtos de machine learning (ML) e as práticas recomendadas para produtos de ML. Para obter um resumo completo dos requisitos e recomendações, consulte a Resumo dos requisitos e recomendações para listagens de produtos de ML.

nota

Um AWS Marketplace representante pode entrar em contato com você para ajudá-lo a atender a esses requisitos, caso seus produtos publicados não os atendam.

Ativos necessários

Antes de criar uma lista de produtos de machine learning, verifique se você tem os seguintes ativos necessários:

Práticas recomendadas gerais para produtos de ML

Forneça as seguintes informações para seu produto de machine learning:

  • Para obter descrições de produtos, inclua o seguinte:

    • O que seu modelo faz

    • Quem é o cliente-alvo

    • Qual é o caso de uso mais importante

    • Como seu modelo foi treinado ou a quantidade de dados usada

    • Quais são as métricas de desempenho e os dados de validação usados

    • Se for médico, se o modelo é ou não para uso em diagnóstico

  • Por padrão, os produtos de machine learning são configurados para ter visibilidade pública. No entanto, é possível criar um produto com visibilidade privada. Para obter mais informações, consulte Criação da lista de produtos.

  • (Opcional) Para produtos pagos, ofereça uma avaliação gratuita de 14 a 30 dias para que os clientes experimentem seu produto. Para obter mais informações, consulte Preços de produtos de aprendizado de máquina para AWS Marketplace.

  • (Opcional) Para produtos com pacotes de modelo, se você quiser ativar uma demonstração do produto em tempo real na página de listagem de produtos, entre em contato com a equipe de operações do vendedor do AWS Marketplace. A demonstração do produto permite que um comprador em potencial experimente seu modelo diretamente na página da lista sem assinar ou implantar o modelo sozinho.

Requisitos para informações de uso

Informações claras de uso que descrevam as entradas e saídas esperadas do produto (com exemplos) são cruciais para promover uma experiência positiva para o comprador.

Com cada nova versão do recurso adicionada à lista de produtos, você deve fornecer informações de uso.

Para adicionar informações de uso de um novo produto que você está publicando pela primeira vez, entre no Portal de gerenciamento do AWS Marketplace console. No menu suspenso Produtos, escolha Machine learning. Selecione seu produto. Na opção Visão geral do produto, na opção Iniciar, forneça seu pacote ARN de modelo ou recurso de algoritmo e escolha Adicionar.

Para editar as informações de uso existentes para uma versão específica, escolha Editar na opção Iniciar e, em seguida, Editar versão.

Requisitos para entradas e saídas

Uma explicação clara do formato, com exemplos de entradas e saídas, é importante para ajudar os compradores a entender e usar seu produto. Esse entendimento ajuda os compradores a realizar as transformações necessárias nos dados de entrada para obter os melhores resultados de inferência.

Você será solicitado a fornecer o seguinte ao adicionar seu SageMaker recurso da Amazon à sua lista de produtos.

Entradas e saídas de inferência

Para entrada de inferência, forneça o formato de entrada para o endpoint em tempo real e o trabalho de transformação em lote. Inclua snippets de código para qualquer pré-processamento necessário dos dados. Inclua tipos de MIME conteúdo compatíveis (por exemplo, imagem/jpeg, imagem/png, imagem/bmp), descrições de valores, se aplicável, e limitações. Inclua amostras de entrada hospedadas em GitHub.

Para a saída de inferência, forneça o formato de saída para o endpoint em tempo real e o trabalho de transformação em lote. Inclua o tipo de MIME conteúdo de saída (por exemplo, application/json, image/jpeg) e a descrição dos valores, se aplicável. Inclua amostras de saída hospedadas em GitHub.

Para amostras, forneça arquivos de entrada que funcionem com seu produto. Se o modelo executar a classificação multiclasse, forneça pelo menos um arquivo de entrada de amostra para cada uma das classes.

Entradas de treinamento

Na seção Informações para treinar um modelo, forneça o formato dos dados de entrada e os snippets de código para qualquer pré-processamento necessário dos dados. Inclua tipos de MIME conteúdo compatíveis (por exemplo, imagem/jpeg, imagem/png, imagem/bmp), descrição dos valores, se aplicável, e limitações. Certifique-se de incluir amostras de entrada hospedadas em GitHub.

Explique os recursos opcionais e obrigatórios que podem ser fornecidos pelo comprador e especifique se o modo de entrada PIPE é compatível. Se o treinamento distribuído (treinamento com mais de CPU GPU 1/instância) for suportado, especifique isso. Para ajustar, liste os hiperparâmetros recomendados.

Requisitos para caderno Jupyter

Ao adicionar seu SageMaker recurso à sua lista de produtos, forneça um link para um exemplo de caderno Jupyter hospedado em GitHubque demonstre o fluxo de trabalho completo sem solicitar que o comprador faça o upload ou encontre dados.

Use a AWS SDK for Python (Boto). Um caderno de amostra bem desenvolvido torna mais fácil para os compradores tentarem usar sua lista.

Para produtos de pacotes de modelo, o caderno de amostra demonstra a preparação dos dados de entrada, a criação de um endpoint para inferência em tempo real e o desempenho de trabalhos de transformação em lote. Para obter mais informações, consulte a lista do Model Package e o exemplo de caderno em GitHub. Para ver um exemplo de caderno, consulte auto_insurance. O notebook funciona em tudo Regiões da AWS, sem inserir nenhum parâmetro e sem que o comprador precise localizar os dados da amostra.

nota

Um exemplo de caderno Jupyter subdesenvolvido que não mostra várias entradas possíveis e etapas de pré-processamento de dados pode dificultar que o comprador entenda completamente a proposta de valor do seu produto.

Para produtos de algoritmo, o caderno de amostra demonstra treinamento completo, ajuste, criação de modelos, criação de um endpoint para inferência em tempo real e desempenho de trabalhos de transformação em lote. Para obter mais informações, consulte Lista de algoritmos e Exemplo de caderno de anotações em GitHub. Para exemplos de cadernos, consulte amazon_demo_product e automl on. GitHub Esses cadernos de amostra funcionam em todas as regiões sem inserir nenhum parâmetro e sem que o comprador precise localizar dados de amostra.

nota

A falta de dados de treinamento de exemplo impede que o comprador execute o caderno Jupyter com êxito. Um caderno de exemplo subdesenvolvido pode impedir que os compradores usem seu produto e dificultar a adoção.

Resumo dos requisitos e recomendações para listagens de produtos de ML

A tabela a seguir fornece um resumo dos requisitos e das recomendações para uma página de listagem de produtos de machine learning.

Detalhes Para listas de pacotes de modelo Para listas de algoritmos
Product descriptions
Explique em detalhes o que o produto faz com os tipos de conteúdo compatíveis (por exemplo, “detecta X em imagens”). Obrigatório Obrigatório
Forneça informações convincentes e diferenciadoras sobre o produto (evite adjetivos como “melhor” ou afirmações infundadas). Recomendado Recomendado
Liste os casos de uso mais importantes desse produto. Obrigatório Obrigatório
Descreva os dados (fonte e tamanho) nos quais ele foi treinado e liste todas as limitações conhecidas. Obrigatório Não aplicável
Descreva a estrutura principal na qual o modelo foi construído. Recomendado Recomendado
Resuma a métrica de desempenho do modelo nos dados de validação (por exemplo, “XX.YY percentual de precisão comparada usando o conjunto de dados Z”). Obrigatório Não aplicável
Resuma a latência do modelo e/ou as métricas de taxa de transferência no tipo de instância recomendado. Obrigatório Não aplicável
Descreva a categoria do algoritmo. Por exemplo, “Esse algoritmo de regressão da floresta de decisão é baseado em um conjunto de classificadores estruturados em árvore que são construídos usando a técnica geral de agregação de bootstrap e uma escolha aleatória de recursos”. Não aplicável Obrigatório
Usage information
Para inferência, forneça o formato de entrada para o endpoint em tempo real e o trabalho de transformação em lote. Inclua tipos de MIME conteúdo compatíveis (por exemplo, imagem/jpeg, imagem/png, imagem/bmp), descrição dos valores, se aplicável, e limitações. Consulte Requisitos para entradas e saídas. Obrigatório Obrigatório
Para inferência, forneça amostras de entrada para o endpoint em tempo real e o trabalho de transformação em lote. As amostras devem ser hospedadas em GitHub. Consulte Requisitos para entradas e saídas. Obrigatório Obrigatório
Para inferência, forneça o formato de saída para o endpoint em tempo real e o trabalho de transformação em lote. Inclua o tipo de MIME conteúdo de saída (por exemplo, application/json, image/jpeg) e a descrição dos valores, se aplicável. Consulte Requisitos para entradas e saídas. Obrigatório Obrigatório
Para inferência, forneça amostras de saída para o endpoint em tempo real e o trabalho de transformação em lote. As amostras devem ser hospedadas em GitHub. Consulte Requisitos para entradas e saídas. Obrigatório Obrigatório
Para inferência, forneça um exemplo do uso de um trabalho de transformação de endpoint ou lote. Inclua um exemplo de código usando os comandos AWS Command Line Interface (AWS CLI) ou usando um AWS SDK. Obrigatório Obrigatório
Para treinamento, forneça o formato de entrada. Inclua tipos de MIME conteúdo compatíveis (por exemplo, imagem/jpeg, imagem/png, imagem/bmp), descrição dos valores, se aplicável, e limitações (por exemplo, linhas mínimas de dados necessárias). Consulte Requisitos para entradas e saídas. Não aplicável Obrigatório
Para treinamento, forneça amostras de entrada hospedadas em GitHub. Consulte Requisitos para entradas e saídas. Não aplicável Obrigatório
Para treinamento, forneça um exemplo de execução de trabalhos de treinamento. Descreva os hiperparâmetros suportados, seus intervalos e seu impacto geral. Especifique se o algoritmo suporta ajuste de hiperparâmetros, treinamento distribuído ou GPU instâncias. Inclua exemplos de código, como AWS CLI comandos ou usando um AWS SDK, por exemplo. Não aplicável Obrigatório
Forneça um notebook Jupyter hospedado para GitHub demonstrar o uso completo do seu produto. Consulte Requisitos para caderno Jupyter. Obrigatório Obrigatório
Forneça informações técnicas relacionadas ao uso do produto, incluindo manuais do usuário e dados de amostra. Recomendado Recomendado