View a markdown version of this page

Lista di controllo da eseguire su larga scala - AWS Batch

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Lista di controllo da eseguire su larga scala

Prima di eseguire un carico di lavoro di grandi dimensioni su 50mila o più vCPU, considera la seguente lista di controllo.

Nota

Se hai intenzione di eseguire un carico di lavoro di grandi dimensioni su un milione o più di vCPU o hai bisogno di assistenza per l'esecuzione su larga scala, contatta il tuo team. AWS

  • Controlla le tue quote Amazon EC2: controlla le tue quote Amazon EC2 (note anche come limiti) nel pannello Service Quotas del. Console di gestione AWS Se necessario, richiedi un aumento della quota per il numero massimo di istanze Amazon EC2. Ricorda che le istanze Amazon EC2 Spot e Amazon hanno On-Demand quote separate. Per ulteriori informazioni, vedere Guida introduttiva a Service Quotas.

  • Verifica la tua quota di Amazon Elastic Block Store per ogni regione: ogni istanza utilizza un volume GP2 o GP3 per il sistema operativo. Per impostazione predefinita, la quota per ciascuno Regione AWS è di 300 TiB. Tuttavia, ogni istanza utilizza i conteggi come parte di questa quota. Quindi, assicurati di tenerne conto quando verifichi la quota di Amazon Elastic Block Store per ogni regione. Se la tua quota viene raggiunta, non puoi creare altre istanze. Per ulteriori informazioni, consulta Endpoint e quote di Amazon Elastic Block Store

  • Usa Amazon S3 per lo storage: Amazon S3 offre un throughput elevato e aiuta a eliminare le congetture sulla quantità di storage da fornire in base al numero di processi e istanze in ciascuna zona di disponibilità. Per ulteriori informazioni, consulta Modelli di progettazione basati sulle best practice: ottimizzazione delle prestazioni di Amazon S3.

  • Scalabilità graduale per identificare tempestivamente i punti deboli: per un lavoro che viene eseguito su un milione o più di VCPUS, è consigliabile iniziare con un valore inferiore e aumentare gradualmente, in modo da poter identificare tempestivamente i punti deboli. Ad esempio, inizia eseguendo 50 mila vCPU. Quindi, aumenta il conteggio a 200 mila vCPU, quindi a 500 mila vCPU e così via. In altre parole, continuate ad aumentare gradualmente il numero di vCPU fino a raggiungere il numero desiderato di vCPU.

  • Monitora per identificare tempestivamente potenziali problemi: per evitare potenziali interruzioni e problemi durante l'esecuzione su larga scala, assicurati di monitorare sia l'applicazione che l'architettura. Potrebbero verificarsi interruzioni anche in caso di scalabilità da 1.000 a 5.000 vCPU. Puoi utilizzare Amazon CloudWatch Logs per esaminare i dati di log o utilizzare CloudWatch Embedded Metrics utilizzando una libreria client. Per ulteriori informazioni, consulta CloudWatch Logs agent reference e aws-embedded-metrics