Scala le implementazioni dei pod con Horizontal Pod Autoscaler

Modalità Focus

Scala le implementazioni dei pod con Horizontal Pod Autoscaler - Amazon EKS

Esecuzione di un'applicazione di test di Horizontal Pod Autoscaler

Aiutaci a migliorare questa pagina

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Per contribuire a questa guida per l'utente, scegli il GitHub link Modifica questa pagina nel riquadro destro di ogni pagina.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Aiutaci a migliorare questa pagina

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Per contribuire a questa guida per l'utente, scegli il GitHub link Modifica questa pagina nel riquadro destro di ogni pagina.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Kubernetes Horizontal Pod Autoscaler ridimensiona automaticamente il numero di Pod in una distribuzione, un controller di replica o un set di repliche in base all'utilizzo della CPU da parte di quella risorsa. Ciò consente alle applicazioni di dimensionare orizzontalmente le risorse in base all'aumento della domanda, o di ridurle orizzontalmente quando non sono necessarie, liberando così i nodi per altre applicazioni. Quando imposti una percentuale di utilizzo della CPU target, Horizontal Pod Autoscaler aumenta o riduce le risorse dell'applicazione in modo conforme all'obiettivo prefissato.

Horizontal Pod Autoscaler è una risorsa API standard in Kubernetes il cui funzionamento richiede solo l'installazione di una fonte di parametri, (ad esempio Kubernetes Metrics Server), nel cluster Amazon EKS. Non è necessario implementare o installare Horizontal Pod Autoscaler sul cluster per iniziare a dimensionare le applicazioni. Per ulteriori informazioni, consulta Horizontal Pod Autoscaler nella documentazione Kubernetes.

Utilizza questo argomento per preparare Horizontal Pod Autoscaler per il cluster Amazon EKS e per verificare che funzioni con un'applicazione di esempio.

Nota

Questo argomento si basa sulla procedura dettagliata di Horizontal Pod autoscaler nella documentazione di Kubernetes.

Il cluster Amazon EKS è già esistente. Se Nozioni di base su Amazon EKS non lo fai, vedi.
Kubernetes Metrics Server è già installato. Per ulteriori informazioni, consulta Visualizza l'utilizzo delle risorse con Kubernetes Metrics Server.
Stai utilizzando un client kubectl che è configurato per comunicare con il cluster Amazon EKS.

Esecuzione di un'applicazione di test di Horizontal Pod Autoscaler

In questa sezione implementerai un'applicazione di esempio per verificare il corretto funzionamento di Horizontal Pod Autoscaler.

Nota

Questo esempio si basa sulla procedura dettagliata dell'autoscaler Horizontal Pod nella documentazione di Kubernetes.

Implementa un'applicazione server Web Apache con il comando seguente.
```
kubectl apply -f https://k8s.io/examples/application/php-apache.yaml
```
A questo Pod del server web Apache viene assegnato un limite di CPU di 500 millicpu e funziona sulla porta 80.
Crea una risorsa Horizontal Pod Autoscaler per l’implementazione di php-apache.
```
kubectl autoscale deployment php-apache --cpu-percent=50 --min=1 --max=10
```
Questo comando crea un autoscaler che punta al 50% di utilizzo della CPU per l'implementazione, con un minimo di un Pod e un massimo di dieci Pod. Quando il carico medio della CPU è inferiore al 50 percento, l'autoscaler cerca di ridurre il numero di Pod presenti nella distribuzione, a un minimo di uno. Quando il carico è superiore al 50 percento, l'autoscaler tenta di aumentare il numero di Pod presenti nell'installazione, fino a un massimo di dieci. Per ulteriori informazioni, consulta How does a work? HorizontalPodAutoscaler nella documentazione di Kubernetes.
Descrivere il componente di scalabilità automatica con il comando seguente per visualizzarne i dettagli.
```
kubectl get hpa
```
Di seguito viene riportato un output di esempio:
```
NAME         REFERENCE               TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
php-apache   Deployment/php-apache   0%/50%    1         10        1          51s
```
Come puoi vedere, il carico attuale della CPU è0%, perché non c'è ancora carico sul server. Il numero di Pod è già al limite più basso (uno), quindi non è scalabile.

Crea un carico per il server Web eseguendo un contenitore.


kubectl run -i \
    --tty load-generator \
    --rm --image=busybox \
    --restart=Never \
    -- /bin/sh -c "while sleep 0.01; do wget -q -O- http://php-apache; done"

Per osservare l'incremento dell'implementazione, esegui periodicamente il seguente comando in un terminale separato dal terminale in cui hai eseguito il passaggio precedente.
```
kubectl get hpa php-apache
```
Di seguito viene riportato un output di esempio:
```
NAME         REFERENCE               TARGETS    MINPODS   MAXPODS   REPLICAS   AGE
php-apache   Deployment/php-apache   250%/50%   1         10        5          4m44s
```
Potrebbe essere necessario più di un minuto per aumentare il numero di repliche. Finché la percentuale effettiva della CPU è superiore alla percentuale di destinazione, il conteggio delle repliche aumenta fino a 10. In questo caso, lo è250%, quindi il numero di REPLICAS continua ad aumentare.

Nota
Potrebbero essere necessari alcuni minuti prima che il numero di repliche raggiunga il limite massimo. Se, ad esempio, sono necessarie solo 6 repliche affinché il carico della CPU rimanga pari o inferiore al 50%, il carico non supererà le 6 repliche.
Arresta il carico. Nella finestra del terminale in cui stai generando il caricamento, interrompi il caricamento tenendo premuti i Ctrl+C tasti. Puoi vedere le repliche tornare a 1 eseguendo nuovamente il comando seguente nel terminale in cui stai guardando il ridimensionamento.
```
kubectl get hpa
```
Di seguito viene riportato un output di esempio:
```
NAME         REFERENCE               TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
php-apache   Deployment/php-apache   0%/50%    1         10        1          25m
```
Nota
Il periodo di tempo di default per il ridimensionamento è di cinque minuti, quindi ci vorrà un po' di tempo prima di vedere il conteggio delle repliche raggiungere di nuovo 1, anche quando la percentuale corrente della CPU è 0. L'intervallo di tempo è modificabile. Per ulteriori informazioni, consulta Horizontal Pod Autoscaler nella documentazione Kubernetes.

Al termine dell'esercitazione con l'applicazione di esempio, elimina le risorse php-apache.


kubectl delete deployment.apps/php-apache service/php-apache horizontalpodautoscaler.autoscaling/php-apache

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Vertical Pod Autoscaler

Bilanciamento del carico di rete

In questa pagina

Seleziona le tue preferenze relative ai cookie

Personalizza le tue preferenze relative ai cookie

Essenziali

Prestazione

Funzionali

Pubblicitari

Impossibile salvare le preferenze dei cookie

Scala le implementazioni dei pod con Horizontal Pod Autoscaler

Nota

Esecuzione di un'applicazione di test di Horizontal Pod Autoscaler

Nota

Nota

Nota

In questa pagina

Questa pagina ti è stata utile?

Argomento successivo:

Argomento precedente:

Hai bisogno di aiuto?