Contribuisci a migliorare questa pagina

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Per contribuire a questa guida per l'utente, scegli il GitHub link Modifica questa pagina nel riquadro destro di ogni pagina.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Risolvi i problemi relativi ai cluster Amazon EKS locali su AWS Outposts

Questo argomento illustra alcuni errori comuni che si potrebbero verificare durante l'utilizzo dei cluster locali e il modo in cui risolverli. I cluster locali siano simili ai cluster Amazon EKS sul cloud, ma esistono delle differenze nel modo in cui sono gestiti da Amazon EKS.

Importante

Non terminare mai alcuna istanza del Kubernetes piano di controllo del cluster locale EKS gestita in esecuzione su Outpost a meno che non venga esplicitamente richiesto da Support. AWS La chiusura di queste istanze comporta un rischio per la disponibilità dei servizi del cluster locale, inclusa la perdita del cluster locale nel caso in cui più istanze vengano terminate contemporaneamente. Le istanze del piano di controllo (control-plane) Kubernetes del cluster locale EKS sono identificate dal tag eks-local:controlplane-name sulla console dell’istanza EC2.

I cluster locali vengono creati tramite l'API Amazon EKS, ma vengono eseguiti in modo asincrono. Ciò significa che le richieste all'API Amazon EKS vengono restituite immediatamente per i cluster locali. Tuttavia, queste richieste potrebbero avere esito positivo, anticipare l’errore a causa di errori di convalida degli input oppure fallire e riportare errori di convalida descrittivi. Questo funzionamento è simile a quello dell’API Kubernetes.

I cluster locali non effettuano la transizione a uno stato FAILED. Amazon EKS prova a riconciliare lo stato del cluster con lo stato desiderato richiesto dall'utente in modo continuo. Di conseguenza, un cluster locale può rimanere a lungo nello stato CREATING, fino a quando il problema di base non viene risolto.

I problemi relativi ai cluster locali possono essere scoperti utilizzando il comando describe-cluster Amazon EKS AWS CLI. I problemi relativi ai cluster locali vengono evidenziati dal campo cluster.health della risposta del comando describe-cluster. Il messaggio contenuto in questo campo include un codice di errore, un messaggio descrittivo e gli ID delle risorse correlate. Queste informazioni sono disponibili solo tramite l'API e la AWS CLI di Amazon EKS. Nell'esempio seguente, sostituiscilo my-cluster con il nome del tuo cluster locale.


aws eks describe-cluster --name my-cluster --query 'cluster.health'

Di seguito viene riportato un output di esempio.


{
    "issues": [
        {
            "code": "ConfigurationConflict",
            "message": "The instance type 'm5.large' is not supported in Outpost 'my-outpost-arn'.",
            "resourceIds": [
                "my-cluster-arn"
            ]
        }
    ]
}

Se il problema non è risolvibile, potrebbe essere necessario eliminare il cluster locale e crearne uno nuovo. Ad esempio, ciò potrebbe verificarsi nel caso in cui si provi ad allocare un cluster con un tipo di istanza che non è disponibile sul tuo Outpost. La tabella seguente include gli errori più comuni relativi allo stato di integrità.

Scenario di errore	Codice	Messaggio	ResourceIds
Non è stato possibile trovare le sottoreti fornite.	`ResourceNotFound`	`The subnet ID subnet-id does not exist`	Tutti gli ID di sottorete forniti
Le sottoreti fornite non appartengono allo stesso VPC.	`ConfigurationConflict`	`Subnets specified must belong to the same VPC`	Tutti gli ID di sottorete forniti
Alcune delle sottoreti fornite non appartengono all’Outpost specificato.	`ConfigurationConflict`	`Subnet subnet-id expected to be in outpost-arn, but is in other-outpost-arn`	ID della sottorete problematico
Alcune delle sottoreti fornite non appartengono ad alcun Outpost.	`ConfigurationConflict`	`Subnet subnet-id is not part of any Outpost`	ID della sottorete problematico
Alcune sottoreti fornite non dispongono di indirizzi liberi sufficienti per creare interfacce di rete elastiche per le istanze del piano di controllo (control-plane).	`ResourceLimitExceeded`	`The specified subnet does not have enough free addresses to satisfy the request.`	ID della sottorete problematico
Il tipo di istanza del piano di controllo (control-plane) specificato non è supportato sul tuo Outpost.	`ConfigurationConflict`	`The instance type type is not supported in Outpost outpost-arn`	ARN del cluster
Hai terminato un'istanza Amazon EC2 del piano di controllo oppure `run-instance` ha avuto esito positivo ma sono state riscontrate modifiche a `Terminated`. Ciò può verificarsi per un periodo di tempo dopo la riconnessione dell'Outpost e gli errori interni di Amazon EBS causano il fallimento di un flusso di lavoro interno di Amazon EC2.	`InternalFailure`	`EC2 instance state "Terminated" is unexpected`	ARN del cluster
Capacità insufficiente nell'Outpost. Ciò può verificarsi anche quando viene creato un cluster se un Outpost viene disconnesso dalla AWS regione.	`ResourceLimitExceeded`	`There is not enough capacity on the Outpost to launch or start the instance.`	ARN del cluster
Il tuo account supera la quota del gruppo di sicurezza	`ResourceLimitExceeded`	Messaggio di errore restituito dall'API Amazon EC2	ID del VPC di destinazione
Il tuo account supera la quota dell'interfaccia di rete elastica	`ResourceLimitExceeded`	Messaggio di errore restituito dall'API Amazon EC2	ID della sottorete di destinazione
Le istanze del piano di controllo non erano raggiungibili tramite Systems Manager AWS . Per la risoluzione, consulta la sezione Le istanze del piano di controllo non sono raggiungibili tramite AWS Systems Manager.	`ClusterUnreachable`	Le istanze del piano di controllo di Amazon EKS non sono raggiungibili tramite SSM. Verifica la configurazione SSM e di rete e fai riferimento alla documentazione per la risoluzione dei problemi di EKS su Outposts.	ID di istanza Amazon EC2
Si è verificato un errore durante la raccolta dei dettagli per un gruppo di sicurezza gestito o un'interfaccia di rete elastica.	In base al codice di errore del client Amazon EC2.	Messaggio di errore restituito dall'API Amazon EC2	Tutti gli ID dei gruppi di sicurezza gestiti
Si è verificato un errore durante l'autorizzazione o la revoca delle regole di ingresso dei gruppi di sicurezza. Questo vale per i gruppi di sicurezza sia del cluster sia del piano di controllo.	In base al codice di errore del client Amazon EC2.	Messaggio di errore restituito dall'API Amazon EC2	ID gruppo di sicurezza problematico
Si è verificato un errore durante l'eliminazione di un'interfaccia di rete elastica per un'istanza del piano di controllo	In base al codice di errore del client Amazon EC2.	Messaggio di errore restituito dall'API Amazon EC2	ID dell'interfaccia di rete elastica problematica

La tabella seguente elenca gli errori di altri AWS servizi presentati nel campo di integrità della risposta. describe-cluster

Codice di errore Amazon EC2	Codice del problema di integrità del cluster	Description
`AuthFailure`	`AccessDenied`	Questo problema può verificarsi per una serie di motivi. Di solito si verificano se un tag utilizzato dal servizio per definire la policy dei ruoli collegati al servizio viene rimosso accidentalmente dal piano di controllo. In tal caso, Amazon EKS non può più gestire e monitorare queste AWS risorse.
`UnauthorizedOperation`	`AccessDenied`	Questo problema può verificarsi per una serie di motivi. Di solito si verificano se un tag utilizzato dal servizio per definire la policy dei ruoli collegati al servizio viene rimosso accidentalmente dal piano di controllo. In tal caso, Amazon EKS non può più gestire e monitorare queste AWS risorse.
`InvalidSubnetID.NotFound`	`ResourceNotFound`	Questo errore si verifica quando non viene trovato l’ID di sottorete per le regole di ingresso di un gruppo di sicurezza.
`InvalidPermission.NotFound`	`ResourceNotFound`	Questo errore si verifica quando le autorizzazioni per le regole di ingresso di un gruppo di sicurezza non sono corrette.
`InvalidGroup.NotFound`	`ResourceNotFound`	Questo errore si verifica quando non viene trovato il gruppo delle regole di ingresso di un gruppo di sicurezza.
`InvalidNetworkInterfaceID.NotFound`	`ResourceNotFound`	Questo errore si verifica quando non viene trovato l’ID dell’interfaccia di rete per le regole di ingresso di un gruppo di sicurezza.
`InsufficientFreeAddressesInSubnet`	`ResourceLimitExceeded`	Questo errore si verifica quando viene superata la quota di risorse della sottorete.
`InsufficientCapacityOnOutpost`	`ResourceLimitExceeded`	Questo errore si verifica quando viene superata la quota di capacità dell'outpost.
`NetworkInterfaceLimitExceeded`	`ResourceLimitExceeded`	Questo errore si verifica quando viene superata la quota dell'interfaccia di rete elastica.
`SecurityGroupLimitExceeded`	`ResourceLimitExceeded`	Questo errore si verifica quando viene superata la quota del gruppo di sicurezza.
`VcpuLimitExceeded`	`ResourceLimitExceeded`	Ciò si verifica quando si crea un'istanza Amazon EC2 in un nuovo account. L'errore potrebbe essere simile al seguente: "`You have requested more vCPU capacity than your current vCPU limit of 32 allows for the instance bucket that the specified instance type belongs to. Please visit http://aws.amazon.com/contact-us/ec2-request to request an adjustment to this limit."`
`InvalidParameterValue`	`ConfigurationConflict`	Amazon EC2 restituisce questo codice di errore se il tipo di istanza specificato non è supportato nell’Outpost.
Tutti gli altri errori	`InternalFailure`	Nessuno

I cluster locali richiedono autorizzazioni e policy diverse rispetto ai cluster Amazon EKS ospitati nel cloud. Quando un cluster non riesce a creare e produce un InvalidPermissions errore, ricontrolla che al ruolo del cluster che stai utilizzando sia associata la policy AmazonEKSLocalOutpostClusterPolicygestita. Tutte le altre chiamate API richiedono lo stesso set di autorizzazioni dei cluster Amazon EKS sul cloud.

La quantità di tempo necessaria per creare un cluster locale varia a seconda di diversi fattori. Questi fattori includono la configurazione della rete, dell’Outpost e del cluster. In generale, viene creato un cluster locale che passa allo stato ACTIVE entro 15-20 minuti. Se un cluster locale rimane nello stato CREATING, puoi richiamare describe-cluster per informazioni sulla causa nel campo di output cluster.health.

I problemi più comuni sono i seguenti:

Il cluster non può connettersi all'istanza del piano di controllo dalla AWS regione in cui si trova Systems Manager. Puoi eseguire una verifica chiamando aws ssm start-session --target instance-id da un host bastione nella regione. Se il comando non funziona, controlla se Systems Manager è in esecuzione sull’istanza del piano di controllo (control-plane). In alternativa, un'altra soluzione alternativa consiste nell'eliminare il cluster e quindi ricrearlo.
Le istanze del piano di controllo (control-plane) non vengono create a causa delle autorizzazioni della chiave KMS per i volumi EBS. Con le chiavi KMS gestite dall’utente per i volumi EBS crittografati, le istanze del piano di controllo (control-plane) termineranno se la chiave non è accessibile. Se le istanze vengono terminate, passa a una chiave KMS AWS gestita o assicurati che la politica delle chiavi gestite dall'utente conceda le autorizzazioni necessarie al ruolo del cluster.
Le istanze del piano di controllo di Systems Manager potrebbero non avere accesso a Internet. Verifica se la sottorete fornita durante la creazione del cluster dispone di un gateway NAT e un VPC con un gateway Internet. Usa VPC Reachability Analyzer per verificare se l'istanza del control plane può raggiungere il gateway Internet. Per ulteriori informazioni, consulta la sezione Getting started with VPC Reachability Analyzer (Nozioni di base su VPC Reachability Analyzer).
L'ARN del ruolo fornito è privo di alcune policy. Controlla se la policy AWS gestita: è AmazonEKSLocalOutpostClusterPolicy stata rimossa dal ruolo. Ciò può verificarsi anche se uno AWS CloudFormation stack non è configurato correttamente.
Tutte le sottoreti fornite devono essere associate allo stesso Outpost ed essere in grado di raggiungersi tra loro. Quando vengono specificate più sottoreti durante la creazione del cluster, Amazon EKS prova a distribuire le istanze del piano di controllo su più sottoreti.
I gruppi di sicurezza gestiti da Amazon EKS vengono applicati all'interfaccia di rete elastica. Tuttavia, altri elementi di configurazione, come le regole del firewall NACL, potrebbero essere in conflitto con le regole per l'interfaccia di rete elastica.
La configurazione DNS del VPC e della sottorete è configurata in modo errato o mancante. Consulta Creare un VPC e sottoreti per i cluster Amazon EKS su Outposts. AWS

Amazon EKS aggiorna automaticamente tutti i cluster locali esistenti alla versione della piattaforma più recente per la versione secondaria di Kubernetes corrispondente. Per ulteriori informazioni sulle versioni della piattaforma, consulta Scopri le versioni della piattaforma Kubernetes e Amazon EKS per AWS Outposts.

Durante l’implementazione automatica di una versione della piattaforma, lo stato di un cluster cambia in UPDATING. Il processo di aggiornamento consiste nella sostituzione di tutte le istanze del piano di controllo di Kubernetes con nuove istanze contenenti le ultime patch di sicurezza e correzioni di bug rilasciate per la rispettiva versione secondaria di Kubernetes. In generale, il processo di aggiornamento della piattaforma di un cluster locale viene completato in meno di 30 minuti e il cluster torna allo stato ACTIVE. Se un cluster locale rimane nello stato UPDATING per un periodo di tempo prolungato, puoi chiamare describe-cluster per controllare le informazioni sulla causa nel campo di output cluster.health.

Amazon EKS garantisce che almeno due istanze del piano di controllo (control-plane) Kubernetes su tre siano nodi del cluster integri e operativi, al fine di mantenere la disponibilità del cluster locale e prevenire l’interruzione del servizio. Se un cluster locale è bloccato in uno stato UPDATING, di solito è perché c’è qualche problema di infrastruttura o di configurazione che impedisce di garantire la disponibilità minima delle due istanze nel caso in cui il processo continui. Pertanto, il processo di aggiornamento si interrompe per impedire l'interruzione del servizio del cluster locale.

È importante risolvere i problemi di un cluster locale bloccato nello stato UPDATING e risolvere la causa principale in modo che il processo di aggiornamento possa essere completato e ripristinare il cluster locale nello stato ACTIVE con l’elevata disponibilità di tre istanze del piano di controllo (control-plane) Kubernetes.

Non terminare alcuna Kubernetes istanza di cluster locale EKS gestita su Outposts a meno che non venga esplicitamente richiesto da Support. AWS Ciò è particolarmente importante per i cluster locali bloccati nello UPDATING stato, perché esiste un'alta probabilità che un altro nodo del piano di controllo non sia completamente integro e l'interruzione dell'istanza sbagliata potrebbe causare l'interruzione del servizio e il rischio di perdita dei dati del cluster locale.

I problemi più comuni sono i seguenti:

Una o più istanze del piano di controllo non sono in grado di connettersi a Systems Manager a causa di una modifica della configurazione di rete dopo la prima creazione del cluster locale. Puoi eseguire una verifica chiamando aws ssm start-session --target instance-id da un host bastione nella regione. Se il comando non funziona, controlla se Systems Manager è in esecuzione sull’istanza del piano di controllo (control-plane).
Impossibile creare nuove istanze del piano di controllo (control-plane) a causa delle autorizzazioni chiave KMS per i volumi EBS. Con le chiavi KMS gestite dall’utente per i volumi EBS crittografati, le istanze del piano di controllo (control-plane) termineranno se la chiave non è accessibile. Se le istanze vengono terminate, passa a una chiave KMS AWS gestita o assicurati che la politica delle chiavi gestite dall'utente conceda le autorizzazioni necessarie per il ruolo del cluster.
Le istanze del piano di controllo (control-plane) di Systems Manager potrebbero aver perso l’accesso a internet. Verifica se la sottorete fornita durante la creazione del cluster dispone di un gateway NAT e un VPC con un gateway Internet. Usa VPC Reachability Analyzer per verificare se l'istanza del control plane può raggiungere il gateway Internet. Per ulteriori informazioni, consulta la sezione Getting started with VPC Reachability Analyzer (Nozioni di base su VPC Reachability Analyzer). Se le reti private non dispongono di una connessione internet in uscita, assicurati che tutti gli endpoint VPC e gli endpoint gateway richiesti siano ancora presenti nella sottorete regionale del cluster (consulta Accesso tramite sottorete a AWS services).
L'ARN del ruolo fornito è privo di alcune policy. Controlla se la policy AWS gestita: non AmazonEKSLocalOutpostClusterPolicy è stata rimossa dal ruolo.
Una delle nuove istanze del piano di controllo (control-plane) Kubernetes potrebbe aver subito un errore di bootstrap imprevisto. Invia un ticket al centro di Supporto AWS per ulteriori indicazioni sulla risoluzione dei problemi e sulla raccolta dei log in questo caso eccezionale.

Problemi relativi alle AMI:
- Stai utilizzando un'AMI incompatibile. Sono supportate solo le AMI Amazon Linux 2023 ottimizzate per Amazon EKS. Per ulteriori informazioni, consulta Creare nodi Amazon Linux su AWS Outposts.
- Se hai usato un AWS CloudFormation modello per creare i tuoi nodi, assicurati che non usasse un'AMI non supportata.
Manca l' AWS IAM AuthenticatorConfigMap: se manca, devi crearlo. Per ulteriori informazioni, consulta Applica la aws-auth ConfigMap al cluster.
È stato utilizzato un gruppo di sicurezza non corretto: assicurati di utilizzare eks-cluster-sg-cluster-name-uniqueid per il gruppo di sicurezza dei nodi worker. Il gruppo di sicurezza selezionato viene modificato AWS CloudFormation per consentire un nuovo gruppo di sicurezza ogni volta che viene utilizzato lo stack.
A seguito dei passaggi del VPC di collegamento privato imprevisto: vengono passati dati CA (--b64-cluster-ca) o API Endpoint (--apiserver-endpoint) errati.

Quando un Outpost viene disconnesso dalla AWS regione a cui è associato, è probabile che il cluster Kubernetes continui a funzionare normalmente. Tuttavia, se il cluster non funziona correttamente, segui la procedura di risoluzione dei problemi in Preparare i cluster Amazon EKS locali su AWS Outposts per le disconnessioni di rete. Se riscontri altri problemi, contatta l' AWS assistenza. AWS Support può aiutarti a scaricare ed eseguire uno strumento di raccolta dei log. In questo modo, puoi raccogliere i log dalle istanze del piano di controllo del cluster Kubernetes e inviarli a Support AWS per ulteriori indagini.

Quando le istanze del piano di controllo di Amazon EKS non sono raggiungibili tramite AWS Systems Manager (Systems Manager), Amazon EKS visualizza il seguente errore per il cluster.


Amazon EKS control plane instances are not reachable through SSM. Please verify your SSM and network configuration, and reference the EKS on Outposts troubleshooting documentation.

Per risolvere questo problema, assicurati che il tuo VPC e le sottoreti soddisfino i requisiti in Creare un VPC e sottoreti per i cluster Amazon EKS su AWS Outposts e di aver completato i passaggi descritti nella Configurazione di Session Manager nella Systems Manager User Guide. AWS

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Considerazioni sulla capacità

Esegui cluster locali (store di istanze EC2)