As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Pré-requisitos para inferência em lote
Para realizar a inferência em lote, você deve atender aos seguintes pré-requisitos:
-
Certifique-se de que uma IAM identidade tenha as permissões necessárias para enviar e gerenciar trabalhos de inferência em lote.
-
Prepare seu conjunto de dados e faça o upload para um bucket do Amazon S3.
-
Crie um bucket S3 para seus dados de saída.
As etapas a seguir são opcionais:
-
Crie uma função de serviço personalizada AWS Identity and Access Management (IAM) para seu trabalho de inferência em lote com as permissões adequadas. Você pode ignorar esse pré-requisito se planeja usar o para criar automaticamente uma função de serviço AWS Management Console para você.
-
Configure um VPC para proteger os dados em seu S3 enquanto realiza a inferência em lote. Você pode pular esta etapa se não precisar usar umVPC.
Permissões necessárias para inferência em lote
Para que uma IAM identidade envie e gerencie trabalhos de inferência em lote, você deve configurá-la com as permissões necessárias. Você pode anexar a AmazonBedrockFullAccesspolítica para conceder as permissões adequadas à função.
Para restringir as permissões somente às ações usadas para inferência em lote, anexe a seguinte política baseada em identidade a uma função: IAM
{ "Version": "2012-10-17", "Statement": [ { "Sid": "PermissionsBatchInference", "Effect": "Allow", "Action": [ "bedrock:ListFoundationModels", "bedrock:GetFoundationModel", "bedrock:TagResource", "bedrock:UntagResource", "bedrock:ListTagsForResource", "bedrock:CreateModelInvocationJob", "bedrock:GetModelInvocationJob", "bedrock:ListModelInvocationJobs", "bedrock:StopModelInvocationJob" ], "Resource": "*" } ] }
Você pode restringir ainda mais as permissões omitindo ações ou especificando recursos e chaves de condição. Uma IAM identidade pode chamar API operações em recursos específicos. Se você especificar uma API operação que não pode ser usada no recurso especificado na política, o Amazon Bedrock retornará um erro.
Os trabalhos de inferência em lote usam foundation-model
os tipos de model-invocation-job
recursoscustom-model
, e. Você pode reduzir o escopo das permissões especificando esses recursos no Resource
campo. Por exemplo, a política a seguir permite que um usuário com o ID da conta 123456789012
crie trabalhos de inferência em lote na us-west-2
região, usando o Anthropic Claude 3 Haiku modelo:
{ "Version": "2012-10-17", "Statement": [ { "Sid": "CreateBatchInferenceJob", "Effect": "Allow", "Action": [ "bedrock:CreateModelInvocationJob" ], "Resource": [ "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-3-haiku-20240307-v1:0" "arn:aws:bedrock:us-west-2:123456789012:model-invocation-job/*" ] } ] }