Habilitar treinamento - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Habilitar treinamento

Quando adicionar um modelo para compartilhar, você pode, opcionalmente, fornecer um ambiente de treinamento e permitir que os colaboradores da sua organização treinem o modelo compartilhado.

nota

Se você estiver adicionando um modelo tabular, também precisará especificar um formato de coluna e uma coluna de destino para permitir o treinamento.

Após o fornecimento das informações básicas sobre seu modelo, você precisará definir as configurações do trabalho de treinamento que será usado para treinar seu modelo. Isso inclui especificar o ambiente do contêiner, scripts de código, conjuntos de dados, locais de saída e vários outros parâmetros para controlar como é executado o trabalho de treinamento. Para definir as configurações do trabalho de treinamento, siga estas etapas:

  1. Adicione um contêiner para usar no treinamento de modelos. Você pode selecionar um contêiner usado para um trabalho de treinamento existente, trazer seu próprio contêiner no Amazon ECR ou usar um contêiner Amazon SageMaker AI Deep Learning.

  2. Adicionar variáveis de ambiente

  3. Forneça um local para o script de treinamento.

  4. Forneça um ponto de entrada no modo script.

  5. Forneça um URI do Amazon S3 para artefatos de modelo gerados durante o treinamento.

  6. Forneça o URI do Amazon S3 para o conjunto de dados de treinamento padrão.

  7. Forneça um caminho de saída do modelo. O caminho de saída do modelo deve ser o caminho URI do Amazon S3 para qualquer artefato de modelo gerado a partir do treinamento. SageMaker A IA salva os artefatos do modelo como um único arquivo TAR compactado no Amazon S3.

  8. Forneça um conjunto de dados de validação para usar na avaliação do seu modelo durante o treinamento. Os conjuntos de dados de validação devem conter o mesmo número de colunas e os mesmos cabeçalhos de atributos do conjunto de dados de treinamento.

  9. Ative o isolamento da rede. O isolamento de rede isola o contêiner do modelo para que nenhuma chamada de rede de entrada ou saída possa ser feita de ou para o contêiner do modelo.

  10. Forneça canais de treinamento por meio dos quais a SageMaker IA possa acessar seus dados. Por exemplo, você pode especificar canais de entrada chamados train ou test. Para cada canal, especifique um nome de canal e um URI para a localização dos seus dados. Escolha Navegar para pesquisar locais do Amazon S3.

  11. Forneça hiperparâmetros. Adicione todos os hiperparâmetros que os colaboradores devem experimentar durante o treinamento. Forneça uma faixa de valores válidos para esses hiperparâmetros. Esse intervalo é usado para a validação de hiperparâmetros do trabalho de treinamento. Você pode definir intervalos com base no tipo de dados do hiperparâmetro.

  12. Selecione um tipo de instância. Recomendamos o uso de uma instância de GPU com mais memória para treinamento com grandes tamanhos de lote. Para obter uma lista abrangente de instâncias de SageMaker treinamento em todas AWS as regiões, consulte a tabela de preços sob demanda no Amazon SageMaker AI Pricing.

  13. Forneça métricas. Defina métricas para um trabalho de treinamento especificando um nome e uma expressão regular para cada métrica que o seu treinamento monitora. Crie as expressões regulares para capturar os valores das métricas emitidas por seu algoritmo. Por exemplo, a métrica loss pode ter a expressão regular "Loss =(.*?);".