Ajustar um modelo no Studio - Amazon SageMaker

Ajustar um modelo no Studio

O ajuste treina um modelo pré-treinado em um novo conjunto de dados sem precisar ser treinado do zero. Esse processo, também conhecido como aprendizado por transferência, pode produzir modelos precisos com conjuntos de dados menores e menos tempo de treinamento. Para ajustar os modelos de base do JumpStart, navegue até um cartão de detalhes do modelo na interface do usuário do Studio. Para obter mais informações sobre como abrir o JumpStart no Studio, consulte Abrir e usar o JumpStart no Studio. Depois de navegar até o cartão de detalhes do modelo escolhido, selecione Treinar no canto superior direito. Observe que nem todos os modelos têm ajustes disponíveis.

Importante

Alguns modelos de base exigem aceitação explícita de um contrato de licença do usuário final (EULA) antes do ajuste. Para obter mais informações, consulte Aceitação do EULA no Amazon SageMaker Studio.

Configurações do modelo

Ao usar um modelo de base do JumpStart pré-treinado no Amazon SageMaker Studio, a localização do artefato do modelo (URI do Amazon S3) é preenchida por padrão. Para editar o URI padrão do Amazon S3, selecione Inserir localização do artefato do modelo. Nem todos os modelos permitem alterar a localização do artefato do modelo.

Configurações de dados

No campo Dados, forneça um ponto do URI do Amazon S3 para a localização do seu conjunto de dados de treinamento. O URI padrão do Amazon S3 indica um exemplo de conjunto de dados de treinamento. Para editar o URI padrão do Amazon S3, selecione Inserir conjunto de dados de treinamento e altere o URI. Certifique-se de revisar o cartão de detalhes do modelo no Amazon SageMaker Studio para obter informações sobre a formatação de dados de treinamento.

Hiperparâmetros

Você pode personalizar os hiperparâmetros do trabalho de treinamento que são usados para ajustar o modelo. Os hiperparâmetros disponíveis para cada modelo ajustável diferem dependendo do modelo.

Os seguintes hiperparâmetros são comuns entre os modelos:

  • Épocas: Uma época é um ciclo em todo o conjunto de dados. Vários intervalos completam um lote, e vários lotes eventualmente completam uma época. Várias épocas são executadas até que a precisão do modelo atinja um nível aceitável ou quando a taxa de erro caia abaixo de um nível aceitável.

  • Taxa de aprendizado: A quantidade em que os valores devem ser alterados entre as épocas. À medida que o modelo é refinado, seus pesos internos são ajustados e as taxas de erro são verificadas para ver se o modelo melhora. Uma taxa de aprendizado típica é 0,1 ou 0,01, em que 0,01 é um ajuste muito menor e pode fazer com que o treinamento leve muito tempo para convergir, enquanto 0,1 é muito maior e pode fazer com que o treinamento ultrapasse. É um dos principais hiperparâmetros que você pode ajustar para treinar seu modelo. Observe que, para modelos de texto, uma taxa de aprendizado muito menor (5e-5 para BERT) pode resultar em um modelo mais preciso.

  • Tamanho do lote: O número de registros do conjunto de dados que devem ser selecionados para cada intervalo a serem enviados às GPUs para treinamento.

Analise os prompts com dicas de ferramentas e as informações adicionais no cartão de detalhes do modelo na interface do usuário do Studio para saber mais sobre hiperparâmetros específicos do modelo de sua escolha.

Para obter mais informações sobre hiperparâmetros disponíveis, consulte Hiperparâmetros de ajuste normalmente aceitos.

Implantação

Especifique o tipo de instância de treinamento e a localização do artefato de saída para seu trabalho de treinamento. Você só pode escolher entre instâncias que sejam compatíveis com o modelo escolhido por você dentro do ajuste da interface do usuário do Studio. A localização padrão do artefato de saída é o bucket padrão do SageMaker. Para alterar a localização do artefato de saída, selecione Inserir localização do artefato de saída e altere o URI do Amazon S3.

Segurança

Especifique as configurações de segurança a serem usadas em seu trabalho de treinamento, incluindo o perfil do IAM que o SageMaker usa para treinar seu modelo, se seu trabalho de treinamento deve se conectar a uma nuvem privada virtual (VPC) e possíveis chaves de criptografia para proteger seus dados.

Mais informações

No campo Informações adicionais, você pode editar o nome do trabalho de treinamento. Você também pode adicionar e remover tags na forma de pares de chave-valor para ajudar a organizar e a categorizar seus trabalhos de treinamento de ajuste.

Depois de fornecer as informações para sua configuração de ajuste, selecione Enviar. Se o modelo de base pré-treinado que você escolheu ajustar exigir a aceitação explícita com um contrato de licença de usuário final (EULA) antes do treinamento, o EULA será fornecido em uma janela pop-up. Para aceitar os termos do EULA, clique em aceitar. Você é responsável por revisar e cumprir todos os termos de licença aplicáveis e garantir que eles sejam aceitáveis para seu caso de uso antes de baixar ou usar o modelo.