Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Crea un SageMaker HyperPod cluster
Consulta le seguenti istruzioni sulla creazione di un nuovo SageMaker HyperPod cluster utilizzando l'interfaccia utente della SageMaker HyperPod console.
-
Apri la SageMaker console Amazon all'indirizzo https://console.aws.amazon.com/sagemaker/
. -
Scegli HyperPod i cluster nel riquadro di navigazione a sinistra.
-
Nella pagina di SageMaker HyperPod destinazione, scegli Crea HyperPod cluster.
-
Dal menu a discesa di Create HyperPod cluster, scegli Orchestrated by Amazon. EKS
-
Dall'elenco dei EKS cluster Amazon, scegli il EKS cluster con cui desideri configurare il nuovo HyperPod cluster.
-
Se devi creare un nuovo EKS cluster, scegli Crea EKS cluster. Puoi crearlo dalla pagina dell'elenco dei EKS cluster senza dover aprire la EKS console Amazon.
Nota
La VPC sottorete scelta HyperPod deve essere privata.
-
Dopo aver inviato una nuova richiesta di creazione EKS del cluster, attendi che il EKS cluster diventi attivo.
-
Installa il diagramma Helm come indicato in. Installa pacchetti sul EKS cluster Amazon utilizzando Helm
-
Una volta completata la creazione del EKS cluster, scegli Crea HyperPod cluster e poi Orchestrated by. EKS Dovresti essere in grado di trovare e selezionare il nuovo EKS cluster. Per procedere, scegli Seleziona.
-
-
Nella pagina Configura un nuovo HyperPod cluster, imposta le informazioni di base per il cluster, come il nome, le opzioni per abilitare le funzionalità di resilienza del HyperPod cluster e i tag.
-
Per Nome cluster, specifica un nome per il nuovo cluster.
-
Per Resilienza del cluster: ripristino dei nodi, specificare
Automatic
di abilitare il ripristino automatico dei nodi. SageMaker HyperPodsostituisce o riavvia le istanze (nodi) quando l'agente di monitoraggio dello stato rileva problemi. -
Per i tag, aggiungi coppie di chiavi e valori al nuovo cluster e gestisci il cluster come risorsa. AWS Per ulteriori informazioni, consulta Taggare le AWS risorse.
-
Nel passaggio 2: Configurazione dei gruppi di istanze, scegli Crea gruppo di istanze. Ogni gruppo di istanze può essere configurato in modo diverso ed è possibile creare un cluster eterogeneo composto da più gruppi di istanze con vari tipi di istanze. Nella finestra pop-up Crea una configurazione di gruppo di istanze, inserisci le informazioni di configurazione del gruppo di istanze.
Crea una pagina pop-up per il gruppo di istanze, configura un nuovo gruppo di istanze seguendo le indicazioni dell'interfaccia utente.
-
Per il nome del gruppo di istanze, specifica un nome per il gruppo di istanze.
-
Per Seleziona il tipo di istanza, scegliete l'istanza per il gruppo di istanze.
-
Per Quantità, specificate un numero intero che non superi la quota di istanza per l'utilizzo del cluster.
-
Prepara uno script di configurazione del ciclo di vita e caricalo su un bucket Amazon S3, ad esempio.
s3://sagemaker-amzn-s3-demo-bucket>/<lifecycle-script-directory>/src/
Per iniziare rapidamente, scarica lo script di esempio
on_create.sh
dall' GitHub archivio AWS Home Distributed Training e caricalo nel bucket S3. Questo script configura il file di registrazione /var/log/provision/provisioning.log
necessario per raccogliere i log dai CloudWatch contenitori Pod. È inoltre possibile includere istruzioni di configurazione aggiuntive, una serie di script di configurazione o comandi da eseguire durante la fase di provisioning del HyperPod cluster. -
Per il bucket S3 URI per gli script del ciclo di vita, inserisci il percorso Amazon S3 in cui sono archiviati gli script del ciclo di vita.
-
Per Directory path to entry point script nel percorso Amazon S3 di base, inserisci il nome del file dello script del ciclo di vita in Amazon S3 path to lifecycle script files. Se utilizzi lo script di esempio fornito, inserisci.
on_create.sh
-
Per il IAM ruolo, scegliete il IAM ruolo che avete creato per SageMaker HyperPod le risorse, seguendo la sezioneIAMruolo per SageMaker HyperPod.
-
In Configurazione avanzata, puoi configurare le seguenti configurazioni opzionali.
-
(Facoltativo) Per Thread per core, specificate se disabilitare
1
il multithreading e abilitare il multithreading.2
Per scoprire quale tipo di istanza supporta il multithreading, consulta la tabella di riferimento dei CPUcore e dei thread per CPU core per tipo di istanza nella Amazon User Guide. EC2 -
(Facoltativo) Per le configurazioni di storage di istanze aggiuntive, specifica un numero intero compreso tra 1 e 16384 per impostare la dimensione di un volume Elastic Block Store () aggiuntivo in gigabyte (GB)EBS. Il EBS volume è collegato a ciascuna istanza del gruppo di istanze. Il percorso di montaggio predefinito per il EBS volume aggiuntivo è
/opt/sagemaker
. Dopo aver creato correttamente il cluster, è possibile SSH accedere alle istanze del cluster (nodi) e verificare se il EBS volume è montato correttamente eseguendo ildf -h
comando. Il collegamento di un EBS volume aggiuntivo fornisce uno storage stabile, fuori istanza e persistente in modo indipendente, come descritto nella sezione EBSVolumi Amazon della Amazon Elastic Block Store User Guide.
-
-
-
Per un controllo approfondito dello stato, seleziona i controlli di integrità avanzati che desideri eseguire sulle istanze. Per ulteriori informazioni, consulta Controlli sanitari approfonditi.
-
Nel passaggio 3: Configurazione avanzata, configura le impostazioni di rete all'interno del cluster e in-and-out del cluster. Per l'orchestrazione del SageMaker HyperPod cluster con AmazonEKS, VPC viene impostato automaticamente su quello configurato con il EKS cluster selezionato.
-
Nella Fase 4: Rivedi e crea, rivedi la configurazione che hai impostato dalla Fase 1 alla Fase 3 e completa l'invio della richiesta di creazione del cluster.
-
Dopo che lo stato del cluster diventa
InService
, puoi iniziare ad accedere ai nodi del cluster. Per accedere ai nodi del cluster e iniziare a eseguire carichi di lavoro ML, consulta. Offerte di lavoro sui SageMaker HyperPod cluster