Ajuste um modelo no Studio - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Ajuste um modelo no Studio

O ajuste fino treina um modelo pré-treinado em um novo conjunto de dados sem precisar ser treinado do zero. Esse processo, também conhecido como aprendizado por transferência, pode produzir modelos precisos com conjuntos de dados menores e menos tempo de treinamento. Para ajustar os modelos JumpStart básicos, navegue até um cartão de detalhes do modelo na interface do usuário do Studio. Para obter mais informações sobre como abrir JumpStart no Studio, consulteAbra e use JumpStart no Studio. Depois de navegar até o cartão de detalhes do modelo de sua escolha, escolha Trem no canto superior direito. Observe que nem todos os modelos têm ajustes finos disponíveis.

Importante

Alguns modelos básicos exigem a aceitação explícita de um contrato de licença do usuário final (EULA) antes do ajuste fino. Para obter mais informações, consulte EULAaceitação no Amazon SageMaker Studio.

Configurações do modelo

Ao usar um modelo JumpStart básico pré-treinado no Amazon SageMaker Studio, a localização do artefato do modelo (Amazon URI S3) é preenchida por padrão. Para editar o Amazon S3 padrãoURI, escolha Inserir localização do artefato do modelo. Nem todos os modelos oferecem suporte à alteração da localização do artefato do modelo.

Configurações de dados

No campo Dados, forneça um URI ponto Amazon S3 para a localização do seu conjunto de dados de treinamento. O Amazon S3 padrão URI aponta para um exemplo de conjunto de dados de treinamento. Para editar o Amazon S3 padrãoURI, escolha Inserir conjunto de dados de treinamento e altere o. URI Certifique-se de revisar o cartão de detalhes do modelo no Amazon SageMaker Studio para obter informações sobre a formatação dos dados de treinamento.

Hiperparâmetros

Você pode personalizar os hiperparâmetros do trabalho de treinamento que são usados para ajustar o modelo. Os hiperparâmetros disponíveis para cada modelo ajustável diferem dependendo do modelo.

Os seguintes hiperparâmetros são comuns entre os modelos:

  • Épocas – Uma época é um ciclo em todo o conjunto de dados. Vários intervalos completam um lote, e vários lotes eventualmente completam uma época. Várias épocas são executadas até que a precisão do modelo atinja um nível aceitável ou quando a taxa de erro caia abaixo de um nível aceitável.

  • Taxa de aprendizado – A quantidade em que os valores devem ser alterados entre as épocas. À medida que o modelo é refinado, seus pesos internos são ajustados e as taxas de erro são verificadas para ver se o modelo melhora. Uma taxa de aprendizado típica é 0,1 ou 0,01, em que 0,01 é um ajuste muito menor e pode fazer com que o treinamento leve muito tempo para convergir, enquanto 0,1 é muito maior e pode fazer com que o treinamento ultrapasse. É um dos principais hiperparâmetros que você pode ajustar para treinar seu modelo. Observe que, para modelos de texto, uma taxa de aprendizado muito menor (5e-5 paraBERT) pode resultar em um modelo mais preciso.

  • Tamanho do lote — O número de registros do conjunto de dados que devem ser selecionados para cada intervalo a serem enviados ao GPUs para treinamento.

Analise as dicas de ferramentas e as informações adicionais no cartão de detalhes do modelo na interface do usuário do Studio para saber mais sobre hiperparâmetros específicos do modelo de sua escolha.

Para obter mais informações sobre os hiperparâmetros disponíveis, consulteHiperparâmetros de ajuste fino comumente suportados.

Implantação

Especifique o tipo de instância de treinamento e a localização do artefato de saída para seu trabalho de treinamento. Você só pode escolher entre instâncias que sejam compatíveis com o modelo de sua escolha dentro do ajuste fino da interface do usuário do Studio. A localização padrão do artefato de saída é o bucket SageMaker padrão. Para alterar a localização do artefato de saída, escolha Inserir localização do artefato de saída e altere o Amazon S3. URI

Segurança

Especifique as configurações de segurança a serem usadas em seu trabalho de treinamento, incluindo a IAM função SageMaker usada para treinar seu modelo, se seu trabalho de treinamento deve se conectar a uma nuvem privada virtual (VPC) e quaisquer chaves de criptografia para proteger seus dados.

Mais informações

No campo Informações adicionais, você pode editar o nome do trabalho de treinamento. Você também pode adicionar e remover tags na forma de pares de valores-chave para ajudar a organizar e categorizar seus trabalhos de treinamento de ajuste fino.

Depois de fornecer informações para sua configuração de ajuste fino, escolha Enviar. Se o modelo básico pré-treinado que você escolheu ajustar exigir a concordância explícita de um contrato de licença de usuário final (EULA) antes do treinamento, ele EULA será fornecido em uma janela pop-up. Para aceitar os termos doEULA, escolha Aceitar. Você é responsável por revisar e cumprir todos os termos de licença aplicáveis e garantir que eles sejam aceitáveis para seu caso de uso antes de baixar ou usar o modelo.