Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Errori comuni e risoluzione dei problemi
Gli errori si verificano AWS Batch spesso a livello di applicazione o sono causati da configurazioni di istanza che non soddisfano i requisiti lavorativi specifici. Altri problemi includono lavori che rimangono bloccati nello RUNNABLE
stato o gli ambienti di calcolo che rimangono bloccati in uno INVALID
stato. Per ulteriori informazioni sulla risoluzione dei problemi relativi al blocco RUNNABLE
dello stato dei lavori, consultaLavori bloccati in uno status RUNNABLE. Per informazioni sulla risoluzione dei problemi degli ambienti di calcolo in uno INVALID
stato, consultaINVALIDambiente di calcolo.
-
Controlla le CPU quote di Amazon EC2 Spot v: verifica che le quote di servizio attuali soddisfino i requisiti del lavoro. Ad esempio, supponiamo che la tua attuale quota di servizio sia 256 vCPUs e che il lavoro richieda 10.000. vCPUs Quindi, la quota di servizio non soddisfa i requisiti di mansione. Per ulteriori informazioni e istruzioni per la risoluzione dei problemi, consulta le quote di EC2 servizio Amazon e Come posso aumentare la quota di servizio del mio AmazonEC2resources?
. -
I lavori falliscono prima dell'esecuzione dell'applicazione: alcuni processi potrebbero fallire a causa di un
DockerTimeoutError
errore o di unCannotPullContainerError
errore. Per informazioni sulla risoluzione dei problemi, vedi Come si risolve l'errore DockerTimeoutError "" in AWS Batch?. -
Indirizzi IP insufficienti: il numero di indirizzi IP nelle sottoreti VPC e nelle sottoreti può limitare il numero di istanze che è possibile creare. Utilizza Classless Inter-Domain Routings (CIDRs) per fornire più indirizzi IP di quelli necessari per eseguire i carichi di lavoro. Se necessario, puoi anche creare uno spazio dedicato VPC con un ampio spazio di indirizzi. Ad esempio, è possibile creare una sottorete VPC con più CIDRs ingressi
10.x.0.0/16
e una sottorete in ogni zona di disponibilità con un CIDR di10.x.y.0/17
. In questo esempio, x è compreso tra 1-4 e y è 0 o 128. Questa configurazione fornisce 36.000 indirizzi IP in ogni sottorete. -
Verifica che le istanze siano registrate su Amazon EC2: se vedi le tue istanze nella EC2 console Amazon, ma nessuna istanza del contenitore Amazon Elastic Container Service nel tuo ECS cluster Amazon, l'ECSagente Amazon potrebbe non essere installato su una Amazon Machine Image (). AMI Inoltre, l'Amazon ECS Agent, gli Amazon EC2 Data presenti nel tuo AMI modello o il modello di lancio potrebbero non essere configurati correttamente. Per isolare la causa principale, crea un'EC2istanza Amazon separata o connettiti a un'istanza esistente utilizzandoSSH. Per ulteriori informazioni, consulta la configurazione di Amazon ECS Container Agent, Amazon ECS Log File Locations eRisorsa di calcolo AMIs.
-
Esamina la AWS dashboard: esamina la AWS dashboard per verificare lo stato del lavoro previsto e che l'ambiente di calcolo sia scalabile come previsto. Puoi anche controllare i registri dei lavori. CloudWatch
-
Verifica che l'istanza sia stata creata: se viene creata un'istanza, significa che l'ambiente di calcolo è stato scalato come previsto. Se le tue istanze non sono state create, trova le sottoreti associate nel tuo ambiente di calcolo da modificare. Per ulteriori informazioni, consulta Verificare un'attività di ridimensionamento per un gruppo Auto Scaling.
Ti consigliamo inoltre di verificare che le tue istanze siano in grado di soddisfare i relativi requisiti lavorativi. Ad esempio, un processo potrebbe richiedere 1 TiB di memoria, ma l'ambiente di calcolo utilizza un tipo di istanza C5 limitato a 192 GB di memoria.
-
Verifica che le tue istanze siano state richieste da AWS Batch: controlla la cronologia del gruppo Auto Scaling per verificare che le tue istanze siano state richieste da. AWS Batch Questa è un'indicazione di come Amazon EC2 tenta di acquisire istanze. Se ricevi un errore che indica che Amazon EC2 Spot non può acquisire un'istanza in una zona di disponibilità specifica, è possibile che la zona di disponibilità non offre una famiglia di istanze specifica.
-
Verifica che le istanze si registrino su Amazon ECS: se vedi istanze nella EC2 console Amazon, ma nessuna istanza di ECS container Amazon nel tuo ECS cluster Amazon, l'ECSagente Amazon potrebbe non essere installato su Amazon Machine Image (). AMI Inoltre, l'Amazon ECS Agent, gli Amazon EC2 Data presenti nel tuo AMI modello o il modello di lancio potrebbero non essere configurati correttamente. Per isolare la causa principale, crea un'EC2istanza Amazon separata o connettiti a un'istanza esistente utilizzandoSSH. Per ulteriori informazioni, consulta il file di configurazione CloudWatch dell'agente: sezione Logs, Amazon ECS Log File Locations eRisorsa di calcolo AMIs.
-
Apri un ticket di assistenza: se continui a riscontrare problemi dopo la risoluzione dei problemi e disponi di un piano di supporto, apri un ticket di supporto. Nel ticket di assistenza, assicurati di includere informazioni sul problema, le specifiche del carico di lavoro, la configurazione e i risultati dei test. Per ulteriori informazioni, consulta Confronta AWS Support
i piani. -
Consulta i HPC forum AWS Batch e: per ulteriori informazioni, consulta i HPC
forum AWS Batch e. -
Consulta la dashboard AWS Batch di monitoraggio del runtime: questa dashboard utilizza un'architettura serverless per acquisire eventi da Amazon ECS e Amazon EC2 per fornire informazioni dettagliate su processi e istanze. AWS Batch Per ulteriori informazioni, consulta AWS Batch Runtime Monitoring Dashboards Solution
.