Conditions préalables pour l'utilisation du SageMaker HyperPod. - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Conditions préalables pour l'utilisation du SageMaker HyperPod.

Les sections suivantes vous présentent les prérequis avant de commencer SageMaker HyperPod.

SageMaker HyperPod quotas

Vous pouvez créer des SageMaker HyperPod clusters en fonction des quotas d'utilisation des clusters de votre AWS compte.

Important

Pour en savoir plus sur SageMaker HyperPod les tarifs, consultez SageMaker HyperPod tarification et Amazon SageMaker Pricing.

Afficher les SageMaker HyperPod quotas Amazon à l'aide de la console AWS de gestion

Recherchez les valeurs par défaut et appliquées d'un quota, également appelé limite, pour l'utilisation du cluster, qui est utilisé pour SageMaker HyperPod.

  1. Ouvrez la Service Quotas console.

  2. Dans le panneau de navigation de gauche, sélectionnez Services AWS .

  3. Dans la liste des AWS services, recherchez et sélectionnez Amazon SageMaker.

  4. Dans la liste des quotas de service, vous pouvez voir le nom du quota de service, la valeur appliquée (si elle est disponible), le quota AWS par défaut et si la valeur du quota est ajustable.

  5. Dans la barre de recherche, saisissez l'utilisation du cluster. Cela indique les quotas d'utilisation du cluster, les quotas appliqués et les quotas par défaut.

Demande de SageMaker HyperPod quotas Amazon à l'aide de la console AWS de gestion

Augmentez vos quotas au niveau du compte ou de la ressource.

  1. Pour augmenter le quota d'instances pour l'utilisation du cluster, sélectionnez le quota que vous souhaitez augmenter.

  2. Si le quota est ajustable, vous pouvez demander une augmentation du quota au niveau du compte ou au niveau des ressources en fonction de la valeur indiquée dans la colonne Ajustabilité.

  3. Pour Augmenter la valeur du quota, entrez la nouvelle valeur. Elle doit être supérieure à la valeur actuelle.

  4. Choisissez Request (Demander).

  5. Pour consulter les demandes en attente ou récemment résolues dans la console, accédez à l'onglet Historique des demandes depuis la page de détails du service ou choisissez Tableau de bord dans le volet de navigation. Pour les demandes en attente, choisissez l’état de la demande pour ouvrir le reçu de la demande. L’état initial d’une demande est Pending (En attente). Une fois que le statut est passé au quota demandé, le numéro de dossier avec AWS Support. Choisissez le numéro de dossier pour ouvrir le billet pour votre demande.

Pour en savoir plus sur les demandes d'augmentation de quotas en général, consultez la section Demander une augmentation de quota dans le Guide de l'utilisateur du AWS Service Quotas.

Configuration SageMaker HyperPod avec Amazon VPC

Pour configurer un SageMaker HyperPod cluster avec votre AmazonVPC, vérifiez les points suivants.

Note

Il est nécessaire pour orchestrer avecEKS, et vous devez l'utiliser VPC pour le HyperPod cluster. Pour orchestrer avec Slurm, la configuration du vôtre est facultative. VPC

  • Si vous souhaitez utiliser les vôtres VPC pour vous connecter SageMaker HyperPod aux AWS ressources de votre compteVPC, vous devez fournir le VPC nom, l'ID Région AWS, l'ID de sous-réseau et l'ID du groupe de sécurité lors de la création SageMaker HyperPod. Si vous souhaitez en créer un nouveauVPC, consultez Create a default VPC ou Create a VPC dans le guide de l'utilisateur d'Amazon Virtual Private Cloud.

  • Il est important que vous créiez toutes vos ressources dans la même zone de disponibilité Région AWS et que vous configuriez les règles du groupe de sécurité pour autoriser la connexion entre les ressources de votreVPC. Supposons, par exemple, que vous créiez un VPC inus-west-2. Vous devez créer un sous-réseau VPC dans cette zone us-west-2a de disponibilité et créer un groupe de sécurité qui autorise tout le trafic entrant (entrant) provenant de l'intérieur du groupe de sécurité et tout le trafic sortant.

  • Vous devez également vous assurer que vous VPC êtes connecté à Amazon Simple Storage Service (Amazon S3). Si vous configurez unVPC, les groupes d' SageMaker HyperPod instances n'ont pas accès à Internet et ne peuvent donc pas se connecter à Amazon S3 pour accéder ou stocker des fichiers tels que des scripts de cycle de vie, des données de formation et des artefacts de modèles. Pour établir une connexion avec Amazon S3 lors de l'utilisationVPC, vous devez créer un VPC point de terminaison. En créant un VPC point de terminaison, vous pouvez autoriser les groupes d' SageMaker HyperPod instances à accéder aux compartiments Amazon S3 qui s'y trouvent. VPC Nous vous recommandons également de créer une politique personnalisée qui autorise uniquement les demandes provenant de votre compte privé VPC à accéder à vos compartiments Amazon S3. Pour plus d'informations, consultez Endpoints for Amazon S3 dans le AWS PrivateLink Guide.

  • Si vous souhaitez créer un HyperPod cluster avec des instances EFA activées, assurez-vous de configurer un groupe de sécurité pour autoriser tout le trafic entrant et sortant à destination et en provenance du groupe de sécurité lui-même. Pour en savoir plus, consultez l'étape 1 : préparer un groupe de sécurité EFA activé dans le guide de l'EC2utilisateur Amazon.

Configuration AWS Systems Manager et exécution en tant que pour le contrôle d'accès des utilisateurs du cluster

SageMaker HyperPod DLAMIest livré avec AWS Systems Manager(SSM) prêt à l'emploi pour vous aider à gérer l'accès à vos groupes d'instances de SageMaker HyperPod cluster. Cette section décrit comment créer des utilisateurs de système d'exploitation (OS) dans vos SageMaker HyperPod clusters et les associer à des IAM utilisateurs et à des rôles. Cela est utile pour authentifier les SSM sessions à l'aide des informations d'identification du compte utilisateur du système d'exploitation.

Activation de l'option Exécuter en tant que dans votre AWS compte

En tant qu'administrateur de AWS compte ou administrateur cloud, vous pouvez gérer l'accès aux SageMaker HyperPod clusters au niveau du IAM rôle ou de l'utilisateur à l'aide de la fonctionnalité Exécuter en tant que dans SSM. Grâce à cette fonctionnalité, vous pouvez démarrer chaque SSM session en utilisant l'utilisateur du système d'exploitation associé au IAM rôle ou à l'utilisateur.

Pour activer Run As dans votre AWS compte, suivez les étapes décrites dans Activer la prise en charge de Run As pour les nœuds gérés sous Linux et macOS. Si vous avez déjà créé des utilisateurs du système d'exploitation dans votre cluster, assurez-vous de les associer à IAM des rôles ou à des utilisateurs en les étiquetant comme indiqué dans l'option 2 de l'étape 5, sous Pour activer l'exécution en tant que support pour les nœuds gérés sous Linux et macOS.

(Facultatif) Configuration SageMaker HyperPod avec Amazon FSx pour Lustre

Pour commencer à utiliser SageMaker HyperPod et à mapper les chemins de données entre le cluster et votre système de fichiers FSx for Lustre, sélectionnez l'un des chemins Régions AWS pris en charge par SageMaker HyperPod. Après avoir choisi celle Région AWS que vous préférez, vous devez également déterminer la zone de disponibilité (AZ) à utiliser. Si vous utilisez des nœuds de SageMaker HyperPod calcul situés dans un AZs autre endroit que celui dans AZs lequel votre système de fichiers FSx for Lustre est configuré Région AWS, il peut y avoir une surcharge de communication et de réseau. Nous vous recommandons d'utiliser le même AZ physique que celui du compte de SageMaker HyperPod service afin d'éviter tout trafic inter-AZ entre les SageMaker HyperPod clusters et votre système de fichiers FSx for Lustre. Assurez-vous également de l'avoir configuré avec votreVPC. Si vous souhaitez utiliser Amazon FSx comme système de fichiers principal pour le stockage, vous devez configurer les SageMaker HyperPod clusters avecVPC.