SageMaker variáveis de ambiente e os caminhos padrão para treinar locais de armazenamento - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

SageMaker variáveis de ambiente e os caminhos padrão para treinar locais de armazenamento

A tabela a seguir resume os caminhos de entrada e saída para conjuntos de dados de treinamento, pontos de verificação, artefatos de modelo e saídas, gerenciados pela plataforma de treinamento. SageMaker

Caminho local na instância SageMaker de treinamento SageMaker variável de ambiente Finalidade Leia no S3 durante o início Leia no S3 durante a reinicialização do Spot Grava no S3 durante o treinamento Grava no S3 quando o trabalho é encerrado

/opt/ml/input/data/channel_name1

SM_ _ CHANNELCHANNEL_NAME

Lendo dados de treinamento dos canais de entrada especificados por meio da classe SageMaker Python SDK Estimator ou da operação. CreateTrainingJobAPI Para obter mais informações sobre como especificá-lo em seu script de treinamento usando o SageMaker PythonSDK, consulte Preparar um script de treinamento.

Sim Sim Não Não

/opt/ml/output/data2

SM_ _ OUTPUT DIR

Salvando saídas como perda, precisão, camadas intermediárias, pesos, gradientes, polarização e TensorBoard saídas compatíveis. Você também pode salvar qualquer saída arbitrária que desejar usando esse caminho. Observe que esse é um caminho diferente daquele usado para armazenar o artefato do modelo final /opt/ml/model/.

Não Não Não Sim

/opt/ml/model3

SM_ _ MODEL DIR

Armazenando o artefato do modelo final. Esse também é o caminho a partir do qual o artefato do modelo é implantado para inferência em tempo real na hospedagem. SageMaker

Não Não Não Sim

/opt/ml/checkpoints4

-

Salvar os pontos de verificação do modelo (o estado do modelo) para retomar o treinamento a partir de um determinado ponto e se recuperar de interrupções inesperadas ou de interrupções no Treinamento de Spot Gerenciado.

Sim Sim Sim Não

/opt/ml/code

SAGEMAKER_SUBMIT_DIRECTORY

Copiar scripts de treinamento, bibliotecas adicionais e dependências.

Sim Sim Não Não

/tmp

-

Ler ou escrever em /tmp como um espaço de rascunho.

Não Não Não Não

1 channel_name é o local para especificar nomes de canais definidos pelo usuário para entradas de dados de treinamento. Cada trabalho de treinamento pode conter vários canais de entrada de dados. É possível especificar até 20 canais de entrada de treinamento por tarefa de treinamento. Observe que o tempo de download dos dados dos canais de dados é contabilizado no tempo faturável. Para obter mais informações sobre caminhos de entrada de dados, consulte Como a Amazon SageMaker fornece informações de treinamento. Além disso, há três tipos de modos de entrada de dados que SageMaker suportam: modo FastFile de arquivo e canal. Para saber mais sobre os modos de entrada de dados para treinamento em SageMaker, consulte Acessar dados de treinamento.

2 SageMaker compacta e grava artefatos de treinamento em TAR arquivos ()tar.gz. O tempo de compactação e upload é contabilizado no tempo faturável. Para obter mais informações, consulte Como a Amazon SageMaker processa os resultados do treinamento.

3 SageMaker compacta e grava o artefato final do modelo em um TAR arquivo ()tar.gz. O tempo de compactação e upload é contabilizado no tempo faturável. Para obter mais informações, consulte Como a Amazon SageMaker processa os resultados do treinamento.

4 Sincronize com o Amazon S3 durante o treinamento. Escreva como está sem compactar em TAR arquivos. Para obter mais informações, consulte Usar pontos de verificação na Amazon SageMaker.