Che cos'è Application Auto Scaling? - Application Auto Scaling

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Che cos'è Application Auto Scaling?

Application Auto Scaling è un servizio Web per sviluppatori e amministratori di sistema che necessitano di una soluzione per scalare automaticamente le proprie risorse scalabili per singoli servizi oltre ad AWS Amazon Auto Scaling. EC2 Con Application Auto Scaling, è possibile configurare il ridimensionamento automatico per le seguenti risorse: : AWS

  • AppStream flotte 2.0

  • Repliche Aurora

  • Endpoint di classificazione dei documenti Amazon Comprehend e di riconoscimento delle identità

  • Tabelle DynamoDB e indici secondari globali

  • Servizi Amazon ECS

  • ElastiCache cluster (Redis OSS) (gruppi di replica)

  • Cluster Amazon EMR

  • Tabelle di Amazon Keyspaces (per Apache Cassandra)

  • Provisioning simultaneo della funzione Lambda

  • Archiviazione broker Amazon Managed Streaming for Apache Kafka (MSK)

  • Cluster Amazon Neptune

  • SageMaker Varianti di endpoint AI

  • SageMaker Componenti di inferenza AI

  • SageMaker Concorrenza fornita senza server AI

  • Richieste di parchi istanze Spot

  • Pool di Amazon WorkSpaces

  • Risorse personalizzate fornite dalle tue applicazioni o dai tuoi servizi. Per ulteriori informazioni, consulta il GitHubrepository.

Per vedere la disponibilità regionale per uno qualsiasi dei AWS servizi sopra elencati, consulta la tabella delle regioni nella tabella delle

Per informazioni sulla scalabilità della tua flotta di EC2 istanze Amazon utilizzando i gruppi di Auto Scaling, consulta la Amazon Auto EC2 Scaling User Guide.

Caratteristiche di Application Auto Scaling

Application Auto Scaling ti consente di dimensionare automaticamente le risorse scalabili in base alle condizioni da te definite.

  • Tracciamento e scalabilità degli obiettivi: ridimensiona una risorsa in base a un valore target per una metrica specifica. CloudWatch

  • Dimensionamento per fasi: esegue il dimensionamento di una risorsa in base a un set di adeguamenti del dimensionamento che variano in base alle dimensioni dell'utilizzo fuori limite segnalato dall'allarme.

  • Dimensionamento pianificato: esegue il dimensionamento di una risorsa solamente una tantum o in base a una pianificazione ricorrente.

  • Scalabilità predittiva: ridimensiona una risorsa in modo proattivo per adattarla al carico previsto in base ai dati storici.

Funzionano con Application Auto Scaling

È possibile configurare il dimensionamento utilizzando le seguenti interfacce a seconda della risorsa che si sta scalando:

Per connettersi a livello di codice a un Servizio AWS, si utilizza un endpoint. l'utente della regione segreta.