Prerequisiti per l'inferenza in batch - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Prerequisiti per l'inferenza in batch

Per eseguire l'inferenza in batch, è necessario soddisfare i seguenti prerequisiti:

  1. Assicuratevi che un'IAMidentità disponga delle autorizzazioni necessarie per inviare e gestire i lavori di inferenza in batch.

  2. Prepara il tuo set di dati e caricalo in un bucket Amazon S3.

  3. Crea un bucket S3 per i tuoi dati di output.

I seguenti passaggi sono facoltativi:

Autorizzazioni richieste per l'inferenza in batch

Affinché un'IAMidentità possa inviare e gestire i lavori di inferenza in batch, è necessario configurarla con le autorizzazioni necessarie. È possibile allegare la AmazonBedrockFullAccesspolitica per concedere le autorizzazioni appropriate al ruolo.

Per limitare le autorizzazioni solo alle azioni utilizzate per l'inferenza in batch, allega la seguente politica basata sull'identità a un ruolo: IAM

{ "Version": "2012-10-17", "Statement": [ { "Sid": "PermissionsBatchInference", "Effect": "Allow", "Action": [ "bedrock:ListFoundationModels", "bedrock:GetFoundationModel", "bedrock:TagResource", "bedrock:UntagResource", "bedrock:ListTagsForResource", "bedrock:CreateModelInvocationJob", "bedrock:GetModelInvocationJob", "bedrock:ListModelInvocationJobs", "bedrock:StopModelInvocationJob" ], "Resource": "*" } ] }

È possibile limitare ulteriormente le autorizzazioni omettendo azioni o specificando risorse e chiavi di condizione. Un'IAMidentità può richiamare API operazioni su risorse specifiche. Se specifichi un'APIoperazione che non può essere utilizzata sulla risorsa specificata nella politica, Amazon Bedrock restituisce un errore.

I processi di inferenza Batch utilizzano i tipi di model-invocation-job risorse foundation-modelcustom-model, e. È possibile ridurre l'ambito delle autorizzazioni specificando queste risorse nel campo. Resource Ad esempio, la seguente politica consente a un utente con l'ID dell'account di 123456789012 creare processi di inferenza in batch nella us-west-2 regione, utilizzando Anthropic Claude 3 Haiku modello:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "CreateBatchInferenceJob", "Effect": "Allow", "Action": [ "bedrock:CreateModelInvocationJob" ], "Resource": [ "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-3-haiku-20240307-v1:0" "arn:aws:bedrock:us-west-2:123456789012:model-invocation-job/*" ] } ] }