Best practice - AWS ParallelCluster

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Best practice

Procedure consigliate: selezione del tipo di istanza principale

Sebbene il nodo master non esegua alcun processo, le sue funzioni e le sue dimensioni sono fondamentali per le prestazioni complessive del cluster.

Quando scegli il tipo di istanza da utilizzare per il tuo nodo principale, desideri valutare i seguenti elementi:

  • Dimensioni del cluster: il nodo master orchestra la logica di scalabilità del cluster ed è responsabile del collegamento di nuovi nodi allo scheduler. Se è necessario scalare verso l'alto e verso il basso il cluster di un numero considerevole di nodi, è necessario fornire al nodo master una capacità di elaborazione aggiuntiva.

  • File system condivisi: quando utilizzi file system condivisi per condividere artefatti tra i nodi di elaborazione e il nodo master, tieni presente che il master è il nodo che espone il server. NFS Per questo motivo desideri scegliere un tipo di istanza con una larghezza di banda di rete sufficiente e una larghezza di EBS banda Amazon dedicata sufficiente per gestire i flussi di lavoro.

Migliori pratiche: prestazioni di rete

Esistono tre suggerimenti che coprono l'intera gamma di possibilità per migliorare la comunicazione di rete.

  • Gruppo di posizionamento: un gruppo di posizionamento del cluster è un raggruppamento logico di istanze all'interno di una singola zona di disponibilità. Per ulteriori informazioni sui gruppi di collocamento, consulta i gruppi di collocamento nella Amazon EC2 User Guide. Puoi configurare il cluster per utilizzare placement_group = your-placement-group-name o lasciare il tuo gruppo di collocamento AWS ParallelCluster crea un gruppo di collocamento con la "compute" strategia conplacement_group = DYNAMIC. Per ulteriori informazioni, vedere placement_group per la modalità coda multipla e placement_group per la modalità coda singola.

  • Rete avanzata: valuta la possibilità di scegliere un tipo di istanza che supporti la rete avanzata. Per ulteriori informazioni, consulta la sezione Enhanced Networking on Linux nella Amazon EC2 User Guide.

  • Elastic Fabric Adapter: per supportare alti livelli di comunicazione scalabile tra istanze, prendi in considerazione la scelta di interfacce di EFA rete per la tua rete. L'hardware EFA di bypass personalizzato del sistema operativo (OS) migliora le comunicazioni tra istanze grazie all'elasticità e alla flessibilità on-demand di AWS cloud. Per configurarne uno Slurm coda del cluster da utilizzareEFA, impostaenable_efa = true. Per ulteriori informazioni sull'utilizzo con EFA AWS ParallelCluster, vedere Elastic Fabric Adapter e enable_efa. Per ulteriori informazioniEFA, consulta Elastic Fabric Adapter nella Amazon EC2 User Guide for Linux Instances.

  • Larghezza di banda dell'istanza: la larghezza di banda varia in base alla dimensione dell'istanza, considera di scegliere il tipo di istanza più adatto alle tue esigenze, consulta Amazon EBS —optimized instances and Amazon volume EBStypes nella Amazon User Guide. EC2

Migliori pratiche: avvisi sul budget

Da gestire AWS ParallelCluster costi delle risorse, ti consigliamo di utilizzare Budget AWS azioni per creare un budget e avvisi relativi alla soglia di budget definita per determinati AWS risorse. Per ulteriori informazioni, vedere Configurazione di un'azione di bilancio nella Budget AWS Guida per l'utente. Puoi anche usare Amazon CloudWatch per creare un allarme di fatturazione. Per maggiori informazioni, consulta Creazione di un allarme di fatturazione per monitorare il preventivo AWS addebiti.

Migliori pratiche: spostare un cluster in un nuovo AWS ParallelCluster versione secondaria o patch

Attualmente ciascuno AWS ParallelCluster la versione minore è autonoma insieme alla sua pclusterCLI. Per spostare un cluster in una nuova versione secondaria o patch, è necessario ricreare il cluster utilizzando le nuove versioni. CLI

Per ottimizzare il processo di spostamento di un cluster in una nuova versione secondaria o per salvare i dati di storage condivisi per altri motivi, si consiglia di utilizzare le seguenti best practice.

  • Salva i dati personali in volumi esterni, come Amazon EFS e FSx for Lustre. In questo modo, puoi spostare facilmente i dati da un cluster all'altro.

  • Crea sistemi di storage condivisi dei tipi elencati di seguito utilizzando AWS CLI oppure AWS Management Console:

    Aggiungili alla nuova configurazione del cluster come file system esistenti. In questo modo, vengono conservati quando si elimina il cluster e possono essere collegati a un nuovo cluster. I sistemi di storage condivisi generalmente comportano costi a prescindere dal fatto che siano collegati o scollegati da un cluster.

    Ti consigliamo di utilizzare i file system Amazon o Amazon FSx for Lustre perché possono essere collegati a più cluster contemporaneamente e puoi collegarli al nuovo cluster prima di eliminare il vecchio cluster. EFS Per ulteriori informazioni, consulta Mounting Amazon EFS file system nella Amazon EFS User Guide e Accessing FSx for Lustre file system nella Amazon FSx for Lustre User Guide.

  • Usa azioni di bootstrap personalizzate per personalizzare le tue istanze anziché azioni personalizzate. AMI Questo ottimizza il processo di creazione perché AMI non è necessario creare una nuova personalizzazione per ogni nuova versione.

  • Sequenza consigliata.

    1. Aggiornare la configurazione del cluster per utilizzare le definizioni dei file system esistenti.

    2. Verifica la pcluster versione e aggiornala se necessario.

    3. Crea e testa il nuovo cluster.

      • Assicurati che i tuoi dati siano disponibili nel nuovo cluster.

      • Assicurati che l'applicazione funzioni nel nuovo cluster.

    4. Se il tuo nuovo cluster è completamente testato e operativo e sei sicuro di non voler utilizzare il vecchio cluster, eliminalo.