As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Personalizar o modelo para melhorar a performance para o caso de uso
A personalização de modelos é o processo de fornecer dados de treinamento a um modelo a fim de melhorar sua performance em casos de uso específicos. É possível personalizar modelos de base do Amazon Bedrock para melhorar sua performance e criar uma experiência melhor para o cliente. No momento, o Amazon Bedrock fornece os métodos de personalização a seguir.
-
Destilação
Use a destilação para transferir conhecimento de um modelo maior e mais inteligente (conhecido como professor) para um modelo menor, mais rápido e econômico (conhecido como aluno). O Amazon Bedrock automatiza o processo de destilação usando as mais recentes técnicas de síntese de dados para gerar respostas diversas e de alta qualidade a partir do modelo do professor e ajustar o modelo do aluno.
Para usar a destilação, você seleciona um modelo de professor cuja precisão deseja obter para seu caso de uso e um modelo de aluno para ajustar. Em seguida, você fornece solicitações específicas de casos de uso como dados de entrada. O Amazon Bedrock gera respostas do modelo do professor para as solicitações fornecidas e, em seguida, usa as respostas para ajustar o modelo do aluno. Opcionalmente, você pode fornecer dados de entrada rotulados como pares de pronto-resposta.
Para obter mais informações sobre o uso da destilação, consulte. Modelo de destilação no Amazon Bedrock
-
Ajuste
Forneça dados rotulados a fim de treinar um modelo para melhorar a performance em tarefas específicas. Ao fornecer um conjunto de dados de treinamento com exemplos rotulados, o modelo aprende a associar quais tipos de saída deve gerar para determinados tipos de entrada. Os parâmetros do modelo são ajustados no processo e a performance do modelo é aprimorada para as tarefas representadas pelo conjunto de dados de treinamento.
-
Pré-treinamento contínuo
Forneça dados não rotulados para pré-treinar um modelo de base familiarizando-o com determinados tipos de entrada. É possível fornecer dados de tópicos específicos a fim de expor um modelo a essas áreas. O processo de pré-treinamento contínuo ajustará os parâmetros do modelo para acomodar os dados de entrada e melhorar seu conhecimento do domínio.
Por exemplo, é possível treinar um modelo com dados privados, como documentos comerciais, que não estão disponíveis publicamente para o treinamento de grandes modelos de linguagem. Além disso, é possível continuar a aprimorar o modelo treinando-o com mais dados não rotulados à medida que estiverem disponíveis.
Para obter informações sobre cotas de personalização de modelos, consulte Amazon Bedrock endpoints and quotas no Referência geral da AWS.
nota
Você recebe cobrança pelo treinamento de modelos com base no número de tokens processados pelo modelo (número de tokens no corpo de dados de treinamento × o número de epochs), e o armazenamento de modelos é cobrado por mês por modelo. Para obter mais informações, consulte Preços do Amazon Bedrock
Execute as etapas a seguir na personalização do modelo.
-
Crie um treinamento e, se aplicável, um conjunto de dados de validação para a tarefa de personalização.
-
Se planejar usar um novo perfil personalizado do IAM, configure as permissões do IAM para acessar os buckets do S3 para os dados. Você também pode usar um perfil existente ou permitir que o console crie automaticamente um perfil com as permissões adequadas.
-
(Opcional) Configure as chaves do KMS e/ou a VPC para obter segurança adicional.
-
Crie um trabalho de ajuste ou de pré-treinamento contínuo, controlando o processo de treinamento por meio do ajuste dos valores dos hiperparâmetros.
-
Analise os resultados observando as métricas de treinamento ou de validação ou usando a avaliação de modelo.
-
Compre throughput provisionado para o modelo personalizado recém-criado.
-
Use o modelo personalizado como faria com um modelo de base nas tarefas do Amazon Bedrock, como inferência de modelos.