Seleziona le tue preferenze relative ai cookie

Utilizziamo cookie essenziali e strumenti simili necessari per fornire il nostro sito e i nostri servizi. Utilizziamo i cookie prestazionali per raccogliere statistiche anonime in modo da poter capire come i clienti utilizzano il nostro sito e apportare miglioramenti. I cookie essenziali non possono essere disattivati, ma puoi fare clic su \"Personalizza\" o \"Rifiuta\" per rifiutare i cookie prestazionali.

Se sei d'accordo, AWS e le terze parti approvate utilizzeranno i cookie anche per fornire utili funzionalità del sito, ricordare le tue preferenze e visualizzare contenuti pertinenti, inclusa la pubblicità pertinente. Per continuare senza accettare questi cookie, fai clic su \"Continua\" o \"Rifiuta\". Per effettuare scelte più dettagliate o saperne di più, fai clic su \"Personalizza\".

Creazione di un cluster SageMaker HyperPod

Modalità Focus
Creazione di un cluster SageMaker HyperPod - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Scopri come creare SageMaker HyperPod cluster orchestrati da Amazon EKS utilizzando la CLI. AWS

  1. Prima di creare un cluster: SageMaker HyperPod

    1. Assicurati di avere un cluster Amazon EKS esistente attivo e funzionante. Per istruzioni dettagliate su come configurare un cluster Amazon EKS, consulta Creare un cluster Amazon EKS nella Guida per l'utente di Amazon EKS.

    2. Installa il diagramma Helm come indicato in. Installa pacchetti sul cluster Amazon EKS utilizzando Helm

  2. Prepara uno script di configurazione del ciclo di vita e caricalo su un bucket Amazon S3, ad esempio. s3://amzn-s3-demo-bucket/Lifecycle-scripts/base-config/

    Per iniziare rapidamente, scarica lo script di esempio on_create.shdall' GitHub archivio AWS Home Distributed Training e caricalo nel bucket S3. Questo script configura il file di registrazione /var/log/provision/provisioning.log necessario per raccogliere i log dai CloudWatch contenitori Pod. È inoltre possibile includere istruzioni di configurazione aggiuntive, una serie di script di configurazione o comandi da eseguire durante la fase di provisioning del HyperPod cluster.

    Importante

    Se crei un Ruolo IAM per SageMaker HyperPod collegamento solo a quello gestito AmazonSageMakerClusterInstanceRolePolicy, il tuo cluster ha accesso ai bucket Amazon S3 con il prefisso specifico. sagemaker-

  3. Prepara un file di richiesta CreateClusterAPI in formato JSON. PerExecutionRole, fornisci l'ARN del ruolo IAM che hai creato con la sezione managed AmazonSageMakerClusterInstanceRolePolicy from. Ruolo IAM per SageMaker HyperPod

    Nota

    Assicurati che il SageMaker HyperPod cluster sia distribuito all'interno dello stesso Virtual Private Cloud (VPC) del cluster Amazon EKS. Le sottoreti e i gruppi di sicurezza specificati nella configurazione del SageMaker HyperPod cluster devono consentire la connettività di rete e la comunicazione con l'endpoint del server API del cluster Amazon EKS.

    // create_cluster.json { "ClusterName": "string", "InstanceGroups": [{ "InstanceGroupName": "string", "InstanceType": "string", "InstanceCount": number, "LifeCycleConfig": { "SourceS3Uri": "s3://amzn-s3-demo-bucket-sagemaker>/<lifecycle-script-directory>/src/", "OnCreate": "on_create.sh" }, "ExecutionRole": "string", "ThreadsPerCore": number, "OnStartDeepHealthChecks": [ "InstanceStress", "InstanceConnectivity" ] }], "VpcConfig": { "SecurityGroupIds": ["string"], "Subnets": ["string"] }, "Tags": [{ "Key": "string", "Value": "string" }], "Orchestrator": { "Eks": { "ClusterArn": "string", } }, "NodeRecovery": "Automatic" }

    Tieni presente quanto segue durante la configurazione per creare un nuovo SageMaker HyperPod cluster associato a un cluster EKS.

    • È possibile configurare fino a 20 gruppi di istanze con il InstanceGroups parametro.

    • PerOrchestator.Eks.ClusterArn, specifica l'ARN del cluster EKS che desideri utilizzare come orchestratore.

    • PerOnStartDeepHealthChecks, aggiungi InstanceStress e abilita. InstanceConnectivity Controlli sanitari approfonditi

    • PerNodeRecovery, specifica Automatic di abilitare il ripristino automatico dei nodi. SageMaker HyperPod sostituisce o riavvia le istanze (nodi) quando l'agente di monitoraggio dello stato rileva problemi.

    • Per il Tags parametro, è possibile aggiungere tag personalizzati per la gestione del SageMaker HyperPod cluster come risorsa. AWS Puoi aggiungere tag al tuo cluster nello stesso modo in cui li aggiungi in altri AWS servizi che supportano i tag. Per ulteriori informazioni sull'etichettatura AWS delle risorse in generale, consulta la Guida per l'utente di Tagging AWS Resources.

    • Per il VpcConfig parametro, specificare le informazioni del VPC utilizzato nel cluster EKS. Le sottoreti devono essere private.

  4. Esegui il comando create-cluster come segue.

    Importante

    Quando si esegue il create-cluster comando con il --cli-input-json parametro, è necessario includere il file:// prefisso prima del percorso completo del file JSON. Questo prefisso è necessario per garantire che AWS CLI riconosca l'input come percorso di file. L'omissione del file:// prefisso genera un errore di analisi del parametro.

    aws sagemaker create-cluster \ --cli-input-json file://complete/path/to/create_cluster.json

    Questo dovrebbe restituire l'ARN del nuovo cluster.

PrivacyCondizioni del sitoPreferenze cookie
© 2025, Amazon Web Services, Inc. o società affiliate. Tutti i diritti riservati.