Pré-requisitos para inferência em lote - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Pré-requisitos para inferência em lote

Para realizar a inferência em lote, você deve atender aos seguintes pré-requisitos:

  1. Certifique-se de que uma IAM identidade tenha as permissões necessárias para enviar e gerenciar trabalhos de inferência em lote.

  2. Prepare seu conjunto de dados e faça o upload para um bucket do Amazon S3.

  3. Crie um bucket S3 para seus dados de saída.

As etapas a seguir são opcionais:

Permissões necessárias para inferência em lote

Para que uma IAM identidade envie e gerencie trabalhos de inferência em lote, você deve configurá-la com as permissões necessárias. Você pode anexar a AmazonBedrockFullAccesspolítica para conceder as permissões adequadas à função.

Para restringir as permissões somente às ações usadas para inferência em lote, anexe a seguinte política baseada em identidade a uma função: IAM

{ "Version": "2012-10-17", "Statement": [ { "Sid": "PermissionsBatchInference", "Effect": "Allow", "Action": [ "bedrock:ListFoundationModels", "bedrock:GetFoundationModel", "bedrock:TagResource", "bedrock:UntagResource", "bedrock:ListTagsForResource", "bedrock:CreateModelInvocationJob", "bedrock:GetModelInvocationJob", "bedrock:ListModelInvocationJobs", "bedrock:StopModelInvocationJob" ], "Resource": "*" } ] }

Você pode restringir ainda mais as permissões omitindo ações ou especificando recursos e chaves de condição. Uma IAM identidade pode chamar API operações em recursos específicos. Se você especificar uma API operação que não pode ser usada no recurso especificado na política, o Amazon Bedrock retornará um erro.

Os trabalhos de inferência em lote usam foundation-model os tipos de model-invocation-job recursoscustom-model, e. Você pode reduzir o escopo das permissões especificando esses recursos no Resource campo. Por exemplo, a política a seguir permite que um usuário com o ID da conta 123456789012 crie trabalhos de inferência em lote na us-west-2 região, usando o Anthropic Claude 3 Haiku modelo:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "CreateBatchInferenceJob", "Effect": "Allow", "Action": [ "bedrock:CreateModelInvocationJob" ], "Resource": [ "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-3-haiku-20240307-v1:0" "arn:aws:bedrock:us-west-2:123456789012:model-invocation-job/*" ] } ] }