Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Prerequisiti per l'inferenza in batch
Per eseguire l'inferenza in batch, è necessario soddisfare i seguenti prerequisiti:
-
Assicuratevi che un'IAMidentità disponga delle autorizzazioni necessarie per inviare e gestire i lavori di inferenza in batch.
-
Prepara il tuo set di dati e caricalo in un bucket Amazon S3.
-
Crea un bucket S3 per i tuoi dati di output.
I seguenti passaggi sono facoltativi:
-
Crea un ruolo di servizio personalizzato AWS Identity and Access Management (IAM) per il tuo lavoro di inferenza in batch con le autorizzazioni appropriate. È possibile ignorare questo prerequisito se si prevede di utilizzare il per AWS Management Console creare automaticamente un ruolo di servizio.
-
Imposta un VPC per proteggere i dati nel tuo S3 durante l'inferenza in batch. Puoi saltare questo passaggio se non hai bisogno di usare un. VPC
Autorizzazioni richieste per l'inferenza in batch
Affinché un'IAMidentità possa inviare e gestire i lavori di inferenza in batch, è necessario configurarla con le autorizzazioni necessarie. È possibile allegare la AmazonBedrockFullAccesspolitica per concedere le autorizzazioni appropriate al ruolo.
Per limitare le autorizzazioni solo alle azioni utilizzate per l'inferenza in batch, allega la seguente politica basata sull'identità a un ruolo: IAM
{ "Version": "2012-10-17", "Statement": [ { "Sid": "BatchInference", "Effect": "Allow", "Action": [ "bedrock:ListFoundationModels", "bedrock:GetFoundationModel", "bedrock:TagResource", "bedrock:UntagResource", "bedrock:ListTagsForResource", "bedrock:CreateModelInvocationJob", "bedrock:GetModelInvocationJob", "bedrock:ListModelInvocationJobs", "bedrock:StopModelInvocationJob" ], "Resource": "*" } ] }
Per limitare ulteriormente le autorizzazioni, è possibile omettere le azioni oppure specificare risorse e chiavi di condizione in base alle quali filtrare le autorizzazioni. Per ulteriori informazioni su azioni, risorse e chiavi di condizione, vedere i seguenti argomenti nel Service Authorization Reference:
-
Azioni definite da Amazon Bedrock: scopri le azioni, i tipi di risorse a cui puoi assegnarle
Resource
sul campo e le chiavi di condizione in base alle quali puoi filtrare le autorizzazioni sul campo.Condition
-
Tipi di risorse definiti da Amazon Bedrock: scopri i tipi di risorse in Amazon Bedrock.
-
Chiavi di condizione per Amazon Bedrock: scopri le chiavi di condizione in Amazon Bedrock.
I processi di inferenza Batch utilizzano i tipi di model-invocation-job
risorse foundation-model
custom-model
, e. È possibile ridurre l'ambito delle autorizzazioni specificando queste risorse nel campo. Resource
Ad esempio, la seguente politica consente a un utente con l'ID dell'account di 123456789012
creare processi di inferenza in batch nella us-west-2
regione, utilizzando Anthropic Claude 3 Haiku modello:
{ "Version": "2012-10-17", "Statement": [ { "Sid": "CreateBatchInferenceJob", "Effect": "Allow", "Action": [ "bedrock:CreateModelInvocationJob" ], "Resource": [ "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-3-haiku-20240307-v1:0" "arn:aws:bedrock:us-west-2:123456789012:model-invocation-job/*" ] } ] }