Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Conditions préalables à l'inférence par lots
Pour effectuer une inférence par lots, vous devez remplir les conditions préalables suivantes :
-
Assurez-vous qu'une IAM identité dispose des autorisations nécessaires pour soumettre et gérer des tâches d'inférence par lots.
-
Préparez votre ensemble de données et chargez-le dans un compartiment Amazon S3.
-
Créez un compartiment S3 pour vos données de sortie.
Les étapes suivantes sont facultatives :
-
Créez un rôle de service personnalisé AWS Identity and Access Management (IAM) pour votre tâche d'inférence par lots avec les autorisations appropriées. Vous pouvez ignorer cette condition préalable si vous prévoyez d'utiliser le AWS Management Console pour créer automatiquement un rôle de service pour vous.
-
Configurez un VPC pour protéger les données de votre S3 lors de l'inférence par lots. Vous pouvez ignorer cette étape si vous n'avez pas besoin d'utiliser unVPC.
Autorisations requises pour l'inférence par lots
Pour qu'une IAM identité puisse soumettre et gérer des tâches d'inférence par lots, vous devez la configurer avec les autorisations nécessaires. Vous pouvez joindre la AmazonBedrockFullAccesspolitique pour accorder les autorisations appropriées au rôle.
Pour limiter les autorisations aux seules actions utilisées pour l'inférence par lots, associez la politique basée sur l'identité suivante à un rôle : IAM
{ "Version": "2012-10-17", "Statement": [ { "Sid": "BatchInference", "Effect": "Allow", "Action": [ "bedrock:ListFoundationModels", "bedrock:GetFoundationModel", "bedrock:TagResource", "bedrock:UntagResource", "bedrock:ListTagsForResource", "bedrock:CreateModelInvocationJob", "bedrock:GetModelInvocationJob", "bedrock:ListModelInvocationJobs", "bedrock:StopModelInvocationJob" ], "Resource": "*" } ] }
Pour restreindre davantage les autorisations, vous pouvez omettre des actions ou spécifier des ressources et des clés de condition permettant de filtrer les autorisations. Pour plus d'informations sur les actions, les ressources et les clés de condition, consultez les rubriques suivantes dans la référence d'autorisation de service :
-
Actions définies par Amazon Bedrock — Découvrez les actions, les types de ressources auxquels vous pouvez les définir sur le
Resource
terrain et les clés de condition sur lesquelles vous pouvez filtrer les autorisations sur leCondition
terrain. -
Types de ressources définis par Amazon Bedrock — Découvrez les types de ressources dans Amazon Bedrock.
-
Clés d'état pour Amazon Bedrock — Découvrez les clés d'état dans Amazon Bedrock.
Les tâches d'inférence par lots utilisent les types de model-invocation-job
ressources foundation-model
custom-model
, et. Vous pouvez limiter les autorisations en spécifiant ces ressources dans le Resource
champ. Par exemple, la politique suivante permet à un utilisateur possédant l'ID de compte de 123456789012
créer des tâches d'inférence par lots dans la us-west-2
région, à l'aide du Anthropic Claude 3 Haiku modèle :
{ "Version": "2012-10-17", "Statement": [ { "Sid": "CreateBatchInferenceJob", "Effect": "Allow", "Action": [ "bedrock:CreateModelInvocationJob" ], "Resource": [ "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-3-haiku-20240307-v1:0" "arn:aws:bedrock:us-west-2:123456789012:model-invocation-job/*" ] } ] }