Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Conditions préalables pour l'utilisation du SageMaker HyperPod.
Les sections suivantes vous présentent les prérequis avant de commencer SageMaker HyperPod.
Rubriques
- SageMaker HyperPod quotas
- Configuration SageMaker HyperPod avec votre Amazon VPC
- Configuration de SageMaker HyperPod clusters sur plusieurs AZs
- Configuration AWS Systems Manager et exécution en tant que pour le contrôle d'accès des utilisateurs du cluster
- (Facultatif) Configuration SageMaker HyperPod avec Amazon FSx pour Lustre
SageMaker HyperPod quotas
Vous pouvez créer des SageMaker HyperPod clusters en fonction des quotas d'utilisation des clusters de votre AWS compte.
Important
Pour en savoir plus sur la SageMaker HyperPod tarification, consultez SageMaker HyperPod tarification et Amazon SageMaker AI Pricing
Consultez les SageMaker HyperPod quotas Amazon à l'aide du AWS Management Console
Recherchez les valeurs par défaut et appliquées d'un quota, également appelé limite, pour l'utilisation du cluster, qui est utilisé pour SageMaker HyperPod.
-
Ouvrez la Service Quotas console
. -
Dans le panneau de navigation de gauche, sélectionnez Services AWS .
-
Dans la liste des AWS services, recherchez et sélectionnez Amazon SageMaker AI.
-
Dans la liste des quotas de service, vous pouvez voir le nom du quota de service, la valeur appliquée (si elle est disponible), le quota AWS par défaut et si la valeur du quota est ajustable.
-
Dans la barre de recherche, saisissez l'utilisation du cluster. Cela indique les quotas d'utilisation du cluster, les quotas appliqués et les quotas par défaut.
Demandez une augmentation du SageMaker HyperPod quota Amazon à l'aide du AWS Management Console
Augmentez vos quotas au niveau du compte ou de la ressource.
-
Pour augmenter le quota d'instances pour l'utilisation du cluster, sélectionnez le quota que vous souhaitez augmenter.
-
Si le quota est ajustable, vous pouvez demander une augmentation du quota au niveau du compte ou au niveau des ressources en fonction de la valeur indiquée dans la colonne Ajustabilité.
-
Pour Augmenter la valeur du quota, entrez la nouvelle valeur. Elle doit être supérieure à la valeur actuelle.
-
Choisissez Request (Demander).
-
Pour consulter les demandes en attente ou récemment résolues dans la console, accédez à l'onglet Historique des demandes depuis la page de détails du service ou choisissez Tableau de bord dans le volet de navigation. Pour les demandes en attente, choisissez l’état de la demande pour ouvrir le reçu de la demande. L’état initial d’une demande est Pending (En attente). Une fois que le statut est passé au quota demandé, le numéro de dossier avec AWS Support. Choisissez le numéro de dossier pour ouvrir le billet pour votre demande.
Pour en savoir plus sur les demandes d'augmentation de quotas en général, consultez la section Demander une augmentation de quota dans le Guide de l'utilisateur du AWS Service Quotas.
Configuration SageMaker HyperPod avec votre Amazon VPC
Pour configurer un SageMaker HyperPod cluster avec votre Amazon VPC, vérifiez les points suivants.
Note
Il est nécessaire pour orchestrer avec Amazon EKS. Pour orchestrer avec Slurm, la configuration de votre propre VPC est facultative.
-
Avant de créer un SageMaker HyperPod cluster avec un VPC personnalisé, assurez-vous que vous disposez Compte AWS d'une capacité suffisante pour créer le nombre requis d'interfaces réseau élastiques (ENIs) au sein de ce VPC. Cette limite est contrôlée par Amazon EC2 et varie selon Région AWS. SageMaker HyperPod ne peut pas demander d'augmentation de limite en votre nom.
Pour vérifier votre limite ENI actuelle :
-
Ouvrez la Service Quotas console
. -
Dans la section Gérer les quotas, utilisez la liste déroulante AWS Services pour rechercher un VPC.
-
Choisissez de consulter les quotas d'Amazon Virtual Private Cloud (Amazon VPC).
-
Recherchez le quota de service, les interfaces réseau par région ou le code de quota
L-DF5E4CA3
.
Si votre limite actuelle est insuffisante pour les besoins de votre SageMaker HyperPod cluster, demandez une augmentation du quota. Garantir au préalable une capacité ENI adéquate permet d'éviter les échecs de création de clusters.
-
-
Si vous souhaitez utiliser votre propre VPC pour vous connecter SageMaker HyperPod aux AWS ressources de votre VPC, vous devez fournir le nom, l'ID, l'ID de sous-réseau et l'ID du groupe de sécurité Région AWS du VPC lors de la création. SageMaker HyperPod Si vous souhaitez créer un nouveau VPC, consultez la section Créer un VPC par défaut ou Créer un VPC dans le guide de l'utilisateur d'Amazon Virtual Private Cloud.
-
Il est important que vous créiez toutes vos ressources au même endroit Région AWS que votre SageMaker HyperPod cluster et que vous configuriez les règles du groupe de sécurité pour autoriser les connexions entre les ressources de votre VPC. Supposons, par exemple, que vous créez un VPC dans.
us-west-2
Vous devez créer des sous-réseaux dans ce VPC à travers une ou plusieurs zones de disponibilité selon les besoins (par exempleus-west-2a
us-west-2b
ou), et créer un groupe de sécurité qui autorise tout le trafic entrant (entrant) provenant de l'intérieur du groupe de sécurité et tout le trafic sortant.Note
Lorsque vous configurez un SageMaker HyperPod cluster, vous pouvez choisir de le déployer sur plusieurs zones de disponibilité. Pour de plus amples informations, veuillez consulter Configuration de SageMaker HyperPod clusters sur plusieurs AZs.
-
Vous devez également vous assurer que votre VPC est connecté à Amazon Simple Storage Service (Amazon S3). Si vous configurez un VPC, les groupes d' SageMaker HyperPod instances n'ont pas accès à Internet et ne peuvent donc pas se connecter à Amazon S3 pour accéder ou stocker des fichiers tels que des scripts de cycle de vie, des données de formation et des artefacts de modèles. Pour établir une connexion avec Amazon S3 lors de l'utilisation d'un VPC, vous devez créer un point de terminaison VPC. En créant un point de terminaison VPC, vous pouvez autoriser les groupes d' SageMaker HyperPod instances à accéder aux compartiments Amazon S3 au sein du même VPC. Nous vous recommandons également de créer une politique personnalisée qui autorise uniquement les demandes provenant de votre VPC privé à accéder à vos compartiments Amazon S3. Pour plus d'informations, consultez la section Endpoints for Amazon S3 dans le AWS PrivateLink Guide.
-
Si vous souhaitez créer un HyperPod cluster avec des instances compatibles EFA, assurez-vous de configurer un groupe de sécurité pour autoriser tout le trafic entrant et sortant à destination et en provenance du groupe de sécurité lui-même. Notez que le fait d'autoriser le trafic sortant
0.0.0.0/0
n'est pas suffisant et peut entraîner l'échec des contrôles de santé EFA. Assurez-vous d'ajouter une règle de trafic sortant explicite au groupe de sécurité afin que les instances du groupe de sécurité puissent communiquer. Pour en savoir plus, consultez l'étape 1 : préparer un groupe de sécurité compatible avec EFA dans le guide de l'utilisateur Amazon EC2 .
Configuration de SageMaker HyperPod clusters sur plusieurs AZs
Vous pouvez configurer vos SageMaker HyperPod clusters sur plusieurs zones de disponibilité (AZs) pour obtenir une capacité d'instance supérieure.
Note
Le trafic Elastic Fabric Adapter (EFA) ne peut pas AZs traverser ou. VPCs Cela ne s’applique pas au trafic IP normal provenant du périphérique ENA d’une interface EFA. Pour plus d'informations, consultez les limites de l'EFA.
Lorsque vous créez un HyperPod cluster, toutes les HyperPod instances sont créées au sein de la même AZ VpcConfig
au niveau du cluster. Pour en savoir plus VPCs et savoir comment en créer de nouveaux pour votre cluster, consultez la section précédente,Configuration SageMaker HyperPod avec votre Amazon VPC.
Vous pouvez configurer votre HyperPod cluster sur plusieurs AZs lorsque vous créez ou mettez à jour votre cluster à l'aide de la console SageMaker AI. Vous pouvez également utiliser ce qui suit APIs.
Lors InstanceGroup
d'une nouvelle création à l'aide de CreateCluster
et UpdateCluster
APIs, vous pouvez utiliser la OverrideVpcConfig
propriété au InstanceGroup
niveau pour remplacer le sous-réseau IDs et les groupes de sécurité pour le. InstanceGroup
La liste suivante fournit des informations surOverrideVpcConfig
. Le OverrideVpcConfig
terrain :
-
C'est immuable. Une fois qu'un groupe d'instances est créé, il est toujours associé au même sous-réseau dans le compte.
-
C'est facultatif.
-
S'il n'est pas spécifié, le niveau du cluster
VpcConfig
sera utilisé par défaut. -
Lorsqu'ils sont spécifiés, les deux sous-champs,
Subnets
etSecurityGroupIds
, sont obligatoires.
-
-
Dispose de deux sous-champs :
-
Subnets
Un sous-champ prend en charge un identifiant de sous-réseau unique pour un groupe d'instances. -
SecurityGroupIds
Un sous-champ prend en charge 1 à 5 entrées.
-
Note
La latence du réseau peut être dégradée pour les charges de travail exécutées sur plusieurs réseaux. AZs
Configuration AWS Systems Manager et exécution en tant que pour le contrôle d'accès des utilisateurs du cluster
SageMaker HyperPod DLAMIest livré avec AWS Systems Manager
Note
Le fait d'accorder aux utilisateurs l'accès aux nœuds HyperPod du cluster leur permet d'installer et d'utiliser des logiciels gérés par les utilisateurs sur les nœuds. Assurez-vous de respecter le principe des autorisations du moindre privilège pour les utilisateurs.
Activation de l'option Exécuter en tant que dans votre AWS compte
En tant qu'administrateur de AWS compte ou administrateur cloud, vous pouvez gérer l'accès aux SageMaker HyperPod clusters au niveau d'un rôle IAM ou d'un utilisateur en utilisant la fonctionnalité Exécuter en tant que de SSM. Grâce à cette fonctionnalité, vous pouvez démarrer chaque session SSM en utilisant l'utilisateur du système d'exploitation associé au rôle ou à l'utilisateur IAM.
Pour activer Run As dans votre AWS compte, suivez les étapes décrites dans Activer la prise en charge de Run As pour les nœuds gérés sous Linux et macOS. Si vous avez déjà créé des utilisateurs du système d'exploitation dans votre cluster, assurez-vous de les associer à des rôles ou à des utilisateurs IAM en les balisant comme indiqué dans l'option 2 de l'étape 5 sous Pour activer l'exécution en tant que support pour les nœuds gérés sous Linux et macOS.
(Facultatif) Configuration SageMaker HyperPod avec Amazon FSx pour Lustre
Pour commencer à utiliser SageMaker HyperPod et à mapper les chemins de données entre le cluster et votre système de fichiers FSx for Lustre, sélectionnez l'un des chemins Régions AWS pris en charge par SageMaker HyperPod. Après avoir choisi celle Région AWS que vous préférez, vous devez également déterminer la zone de disponibilité (AZ) à utiliser.
Si vous utilisez des nœuds de SageMaker HyperPod calcul situés dans un AZs autre endroit que celui dans AZs lequel votre système de fichiers FSx for Lustre est configuré Région AWS, il se peut qu'il y ait une surcharge de communication et de réseau. Nous vous recommandons d'utiliser le même AZ physique que celui du compte de SageMaker HyperPod service afin d'éviter tout trafic inter-AZ entre les SageMaker HyperPod clusters et votre système de fichiers FSx for Lustre. Assurez-vous également de l'avoir configuré avec votre VPC. Si vous souhaitez utiliser Amazon FSx comme système de fichiers principal pour le stockage, vous devez configurer les SageMaker HyperPod clusters avec votre VPC.