Crea un gruppo di istanze miste utilizzando la selezione del tipo di istanza basata sugli attributi - Amazon EC2 Auto Scaling

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Crea un gruppo di istanze miste utilizzando la selezione del tipo di istanza basata sugli attributi

In alternativa alla scelta manuale dei tipi di istanza di un gruppo di istanze miste, puoi specificare un set di attributi dell'istanza che descrivono i requisiti di calcolo. Quando Amazon EC2 Auto Scaling avvia le istanze, tutti i tipi di istanza utilizzati dal gruppo Auto Scaling devono corrispondere agli attributi di istanza richiesti. Questo è noto come selezione del tipo di istanza basata su attributi.

Questo approccio è ideale per carichi di lavoro e framework che possono essere flessibili su quali tipi di istanza utilizzano, come ad esempio container, big data e CI/CD.

Di seguito sono elencati i vantaggi della selezione del tipo di istanza basata su attributi:

  • Flessibilità ottimale per le istanze Spot: Amazon EC2 Auto Scaling può scegliere tra un'ampia gamma di tipi di istanze per il lancio di istanze Spot. Ciò soddisfa la best practice di Spot di flessibilità sui tipi di istanze, che offre al servizio Amazon EC2 Spot una migliore possibilità di trovare e allocare la quantità di capacità di elaborazione richiesta.

  • Usa facilmente i tipi di istanza giusti: con così tanti tipi di istanze disponibili, trovare i tipi di istanza giusti per il tuo carico di lavoro può richiedere molto tempo. Quando si specificano gli attributi dell'istanza, i tipi di istanza avranno automaticamente gli attributi richiesti per il carico di lavoro.

  • Uso automatico di nuovi tipi di istanze: i gruppi di Auto Scaling possono utilizzare tipi di istanze di nuova generazione non appena vengono rilasciati. I tipi di istanza di nuova generazione vengono utilizzati automaticamente quando soddisfano i requisiti e si allineano alle strategie di allocazione scelte per il gruppo con scalabilità automatica.

Come funziona la selezione del tipo di istanza basata su attributi

Con la selezione del tipo di istanza basata sugli attributi, anziché fornire un elenco di tipi di istanza specifici, è possibile fornire un elenco di attributi di istanza richiesti dalle istanze, ad esempio:

  • v CPU count: il numero minimo e massimo di per istanza. vCPUs

  • Memoria: il numero minimo e massimo GiBs di memoria per istanza.

  • Archiviazione locale: se utilizzare EBS o archiviare a istanza i volumi per l'archiviazione locale.

  • Prestazioni affidabili: se utilizzare la famiglia di istanze T, inclusi i tipi T4g, T3a, T3 e T2.

Sono disponibili molte opzioni per definire i requisiti dell'istanza. Per una descrizione di ogni opzione e dei valori predefiniti, consulta InstanceRequirementsAmazon EC2 Auto Scaling API Reference.

Quando il gruppo Auto Scaling deve avviare un'istanza, cercherà i tipi di istanza che corrispondono agli attributi specificati e sono disponibili in quella zona di disponibilità. La strategia di allocazione determina quindi quali tipi di istanza corrispondenti avviare. Per impostazione predefinita, la selezione del tipo di istanza basata sugli attributi ha una funzione di protezione del prezzo abilitata per impedire al gruppo Auto Scaling di lanciare tipi di istanze che superano le soglie di budget.

Per impostazione predefinita, si utilizza il numero di istanze come unità di misura per impostare la capacità desiderata del gruppo Auto Scaling, il che significa che ogni istanza conta come un'unità.

In alternativa, è possibile impostare il valore della capacità desiderata sul numero vCPUs o sulla quantità di memoria. A tale scopo, utilizzate il campo a discesa Tipo di capacità desiderato nell' AWS Management Console UpdateAutoScalingGroupAPIoperazione CreateAutoScalingGroup o la DesiredCapacityType proprietà. Amazon EC2 Auto Scaling avvia quindi il numero di istanze necessarie per soddisfare la capacità v CPU o di memoria desiderata. Ad esempio, se utilizzi vCPUs come tipo di capacità desiderato e utilizzi istanze con 2 istanze vCPUs ciascuna, una capacità desiderata di 10 vCPUs lancerebbe 5 istanze. Si tratta di un'alternativa utile ai pesi delle istanze.

Protezione del prezzo

Con la protezione del prezzo, puoi specificare il prezzo massimo che sei disposto a pagare per EC2 le istanze lanciate dal tuo gruppo Auto Scaling. La protezione del prezzo è una funzionalità che impedisce al gruppo Auto Scaling di utilizzare tipi di istanze che considereresti troppo costosi anche se corrispondono agli attributi specificati.

La protezione del prezzo è abilitata per impostazione predefinita e prevede soglie di prezzo separate per le istanze On-Demand e le istanze Spot. Quando Amazon EC2 Auto Scaling deve lanciare nuove istanze, qualsiasi tipo di istanza con un prezzo superiore alla soglia pertinente non viene avviato.

Protezione dei prezzi su richiesta

Per le istanze On-Demand, definisci il prezzo On-Demand massimo che sei disposto a pagare come percentuale superiore a un prezzo On-Demand identificato. Il prezzo On-Demand identificato è il prezzo del tipo di istanza C, M o R dell'attuale generazione con il prezzo più basso con gli attributi specificati.

Se un valore di protezione del prezzo On-Demand non è definito in modo esplicito, verrà utilizzato un prezzo On-Demand massimo predefinito del 20% superiore al prezzo On-Demand identificato.

Protezione del prezzo spot

Per impostazione predefinita, Amazon EC2 Auto Scaling applicherà automaticamente una protezione ottimale del prezzo delle istanze Spot per scegliere in modo coerente tra un'ampia gamma di tipi di istanze. Puoi anche impostare manualmente la protezione del prezzo. Tuttavia, lasciare che Amazon EC2 Auto Scaling lo faccia per te può aumentare la probabilità che la tua capacità Spot venga soddisfatta.

Puoi specificare manualmente la protezione del prezzo utilizzando una delle seguenti opzioni. Se imposti manualmente la protezione del prezzo, ti consigliamo di utilizzare la prima opzione.

  • Una percentuale di un prezzo On-Demand identificato: il prezzo On-Demand identificato è il prezzo del tipo di istanza C, M o R dell'attuale generazione con il prezzo più basso con gli attributi specificati.

  • Una percentuale superiore a un prezzo Spot identificato: il prezzo Spot identificato è il prezzo del tipo di istanza C, M o R dell'attuale generazione con il prezzo più basso con gli attributi specificati. Non consigliamo di utilizzare questa opzione perché i prezzi Spot possono variare e pertanto anche la soglia di protezione del prezzo potrebbe variare.

Personalizza la protezione del prezzo

Puoi personalizzare le soglie di protezione del prezzo nella console Amazon Auto EC2 Scaling o utilizzando o. AWS CLI SDKs

  • Nella console, utilizza le impostazioni di protezione del prezzo On-Demand e Protezione del prezzo Spot negli attributi aggiuntivi dell'istanza.

  • Nella InstanceRequirementsstruttura, per specificare la soglia di protezione del prezzo delle istanze On-Demand, utilizza la OnDemandMaxPricePercentageOverLowestPrice proprietà. Per specificare la soglia di protezione del prezzo dell'istanza Spot, utilizza la proprietà MaxSpotPriceAsPercentageOfOptimalOnDemandPrice o la SpotMaxPricePercentageOverLowestPrice proprietà.

Se si imposta Desired capacity type (DesiredCapacityType) su vCPUso Memory GiB, la protezione del prezzo si applica in base al prezzo per v CPU o per memoria anziché al prezzo per istanza.

Puoi anche disattivare la protezione del prezzo. Per indicare l'assenza di una soglia di protezione del prezzo, specifica un valore percentuale elevato, ad esempio999999.

Nota

Se nessun tipo di istanza C, M o R dell'attuale generazione corrisponde agli attributi specificati, la protezione del prezzo è comunque applicabile. Se non viene trovata alcuna corrispondenza, il prezzo identificato proviene dai tipi di istanza della generazione corrente con il prezzo più basso o, in mancanza, dai tipi di istanza della generazione precedente con il prezzo più basso, che corrispondono ai tuoi attributi.

Protezione delle prestazioni

La protezione delle prestazioni è una funzionalità che garantisce che il gruppo Auto Scaling utilizzi tipi di istanze simili o superiori a una linea di base prestazionale specificata. Per utilizzare la protezione delle prestazioni, è necessario specificare una famiglia di istanze come riferimento di base. Le funzionalità della famiglia di istanze specificata stabiliscono il livello di prestazioni più basso accettabile. Quando Auto Scaling seleziona i tipi di istanza, considera gli attributi specificati e la linea di base delle prestazioni. I tipi di istanza inferiori alla linea di base delle prestazioni vengono automaticamente esclusi dalla selezione, anche se corrispondono agli altri attributi specificati. Ciò garantisce che tutti i tipi di istanze selezionati offrano prestazioni simili o migliori rispetto alla linea di base stabilita dalla famiglia di istanze specificata. Auto Scaling utilizza questa linea di base per guidare la selezione del tipo di istanza, ma non è garantito che i tipi di istanza selezionati superino sempre la linea di base per ogni applicazione.

Attualmente, questa funzionalità supporta solo CPU le prestazioni come fattore prestazionale di base. Le CPU prestazioni della famiglia di istanze specificata fungono da riferimento prestazionale, garantendo che i tipi di istanze selezionati siano simili o superiori a tale baseline. Le famiglie di istanze con gli stessi CPU processori producono gli stessi risultati di filtraggio, anche se le prestazioni della rete o del disco sono diverse. Ad esempio, specificando una delle due c6in o c6i come riferimento di base si otterranno risultati di filtraggio basati sulle prestazioni identici perché entrambe le famiglie di istanze utilizzano lo stesso processore. CPU

Famiglie di istanze non supportate

Le seguenti famiglie di istanze non sono supportate per la protezione delle prestazioni:

  • c1

  • g3 | g3s

  • hpc7g

  • m1 | m2

  • mac1 | mac2 | mac2-m1ultra | mac2-m2 | mac2-m2pro

  • p3dn | p4d | p5

  • t1

  • u-12tb1 | u-18tb1 | u-24tb1 | u-3tb1 | u-6tb1 | u-9tb1 | u7i-12tb | u7in-16tb | u7in-24tb | u7in-32tb

Se si abilita la protezione delle prestazioni specificando una famiglia di istanze supportata, i tipi di istanze restituiti escluderanno le famiglie di istanze non supportate di cui sopra.

Esempio: imposta una CPU linea di base per le prestazioni

Nell'esempio seguente, il requisito dell'istanza è l'avvio con tipi di istanze con CPU core performanti quanto la c6i famiglia di istanze. In questo modo verranno filtrati i tipi di istanza con CPU processori meno performanti, anche se soddisfano gli altri requisiti di istanza specificati, come il numero di. vCPUs Ad esempio, se gli attributi dell'istanza specificati includono 4 vCPUs e 16 GB di memoria, un tipo di istanza con questi attributi ma con CPU prestazioni inferiori a quelle c6i verrà escluso dalla selezione.

"BaselinePerformanceFactors": { "Cpu": { "References": [ { "InstanceFamily": "c6i" } ] }
Considerazioni

Quando utilizzi la protezione delle prestazioni, considera quanto segue:

  • È possibile specificare i tipi di istanza o gli attributi di istanza, ma non entrambi contemporaneamente.

  • In una configurazione di richiesta è possibile specificare un massimo di quattro strutture InstanceRequirements.

Prerequisiti

Crea un gruppo di istanze miste con selezione del tipo di istanza basata sugli attributi (console)

Usa la procedura seguente per creare un gruppo di istanze miste utilizzando la selezione del tipo di istanza basata su attributi. Per aiutarti a eseguire i passaggi in modo efficiente, alcune sezioni facoltative vengono saltate.

Per la maggior parte dei carichi di lavoro generici, è sufficiente specificare il numero vCPUs e la memoria necessari. Per casi d'uso avanzati, puoi specificare attributi come il tipo di storage, le interfacce di rete, il CPU produttore e il tipo di acceleratore.

Per esaminare le best practice per un gruppo di istanze miste, consulta. Panoramica della configurazione per la creazione di un gruppo di istanze miste

Come creare gruppi di istanze
  1. Apri la EC2 console Amazon all'indirizzo https://console.aws.amazon.com/ec2/e scegli Auto Scaling Groups dal pannello di navigazione.

  2. Sulla barra di navigazione nella parte superiore della schermata, scegli la stessa Regione AWS che utilizzata durante la creazione del modello di avvio.

  3. Selezionare Crea un gruppo con dimensionamento automatico.

  4. Nella pagina Scegli il modello o la configurazione di avvio, in Nome gruppo con dimensionamento automatico, inserisci un nome per il gruppo con dimensionamento automatico.

  5. Per scegliere il modello di avvio, completa le seguenti operazioni:

    1. Come Launch template (Modello di avvio) scegli un modello di avvio esistente.

    2. Per la Versione del modello di avvio, scegli se durante il dimensionamento orizzontale il gruppo con dimensionamento automatico debba usare la versione di default, quella più recente o una versione specifica del modello di avvio.

    3. Verificare che il modello di avvio supporti tutte le opzioni che si intende utilizzare e quindi scegliere Next (Successivo).

  6. Nella pagina Scegli le opzioni di avvio istanza, procedi come segue:

    1. Per Instance type requirements (Requisiti del tipo di istanza), scegli Override launch template (Sostituisci modello di avvio).

      Nota

      Se scegli un modello di lancio che contiene già un set di attributi dell'istanza, ad vCPUs esempio memoria, vengono visualizzati gli attributi dell'istanza. Questi attributi vengono aggiunti alle proprietà del gruppo Auto Scaling, dove puoi aggiornarli dalla console Amazon Auto EC2 Scaling in qualsiasi momento.

    2. In Specificare gli attributi dell'istanza, inizia inserendo i tuoi requisiti vCPUs e quelli di memoria.

      • Per vCPUs, inserisci il numero minimo e massimo desiderato divCPUs. Per non specificare alcun limite, selezionare No minimum (Nessun minimo), No maximum (Nessun massimo) o entrambe le opzioni.

      • Per Memory (GiB) (Memoria [GiB]) inserire la quantità minima e massima di memoria desiderata. Per non specificare alcun limite, selezionare No minimum (Nessun minimo), No maximum (Nessun massimo) o entrambe le opzioni.

    3. (Facoltativo) Per Additional instance attributes (Attributi istanza aggiuntivi), facoltativamente, è possibile specificare uno o più attributi per esprimere i requisiti di calcolo in modo più dettagliato. Ogni attributo aggiuntivo aggiunge ulteriori vincoli alla propria richiesta.

    4. Espandi Anteprima i tipi di istanza corrispondenti per visualizzare i tipi di istanza con gli attributi specificati.

    5. In Opzioni di acquisto delle istanze, per Distribuzione delle istanze, specifica le percentuali del gruppo da avviare rispettivamente come istanze on demand e istanze spot. Se l'applicazione è senza stato, tollerante ai guasti e può gestire un'istanza interrotta, è possibile specificare una percentuale più alta di istanze Spot.

    6. (Facoltativo) Quando specifichi una percentuale per le istanze spot, seleziona Includi capacità di base on demand e specifica quindi la quantità minima di capacità iniziale del gruppo con dimensionamento automatico che deve essere raggiunta dalle istanze on demand. Qualsiasi cosa oltre la capacità di base utilizza le impostazioni Instances distribution (Distribuzione delle istanze) per stabilire quante istanze on demand e istanze Spot avviare.

    7. In Allocation strategies (Strategie di allocazione), Lowest price (Prezzo più basso) viene selezionato automaticamente per On-Demand allocation strategy (Strategia di allocazione on demand) e non può essere cambiato.

    8. Per Spot allocation strategy (Strategia di allocazione Spot), scegli una strategia di allocazione. L'opzione Price capacity optimized (Ottimizzazione per prezzo e capacità) è selezionata per impostazione predefinita. Per impostazione predefinita, l'opzione Lowest price (Prezzo più basso) è nascosta e viene visualizzata solo quando scegli Show all strategies (Mostra tutte le strategie). Se hai scelto Prezzo più basso inserisci il numero di pool con il prezzo più basso da diversificare tra i Pool con prezzi più bassi.

    9. Per il ribilanciamento della capacità, scegli se abilitare o disabilitare il ribilanciamento della capacità. Utilizza il ribilanciamento della capacità per rispondere automaticamente quando le tue istanze spot stanno per terminare a causa di un'interruzione spot. Per ulteriori informazioni, consulta Utilizza il ribilanciamento della capacità per gestire le interruzioni spot di Amazon EC2.

    10. In Rete, per VPC, scegli unVPC. Il gruppo Auto Scaling deve essere creato nello VPC stesso gruppo di sicurezza specificato nel modello di lancio.

    11. Per le zone di disponibilità e le sottoreti, scegli una o più sottoreti tra quelle specificate. VPC Per un'elevata disponibilità, utilizza sottoreti in più zone di disponibilità. Per ulteriori informazioni, consulta Considerazioni sulla scelta delle sottoreti VPC.

    12. Scegli Avanti, Avanti.

  7. Per la fase Configure group size and scaling policies (Configura le dimensioni dei gruppi e le policy di scalabilità), procedi come riportato di seguito:

    1. Per misurare la capacità desiderata in unità diverse dalle istanze, scegli l'opzione appropriata per Dimensioni gruppo, Tipo di capacità desiderata. Sono vCPUssupportate unità e GiB di memoria. Per impostazione predefinita, Amazon EC2 Auto Scaling specifica le unità, che si traducono in numero di istanze.

    2. Per capacità desiderata, le dimensioni iniziali del tuo gruppo con dimensionamento automatico.

    3. Nella sezione Dimensionamento, in Limiti di dimensionamento, se il nuovo valore per la capacità desiderata è maggiore della capacità minima desiderata e della capacità massima desiderata, la capacità massima desiderata viene automaticamente aumentata fino al nuovo valore di capacità desiderato. È possibile modificare questi limiti se necessario. Per ulteriori informazioni, consulta Impostare i limiti di dimensionamento per il gruppo con dimensionamento automatico.

  8. Selezionare Passa a revisione.

  9. Nella pagina Verifica, scegliere Crea gruppo con dimensionamento automatico.

Crea un gruppo di istanze miste con la selezione del tipo di istanza basata sugli attributi ()AWS CLI

Per creare un gruppo di istanze miste tramite la riga di comando

Utilizzare uno dei seguenti comandi:

Configurazione di esempio

Per creare un gruppo Auto Scaling con selezione del tipo di istanza basata sugli attributi utilizzando il AWS CLI, utilizzare il comando seguente. create-auto-scaling-group

Vengono specificati i seguenti attributi di istanza:

  • VCpuCount— I tipi di istanza devono avere un minimo di quattro vCPUs e un massimo di otto. vCPUs

  • MemoryMiB: i tipi di istanza devono avere un minimo di 16.384 MiB di memoria.

  • CpuManufacturers— I tipi di istanza devono essere prodotti da IntelCPU.

aws autoscaling create-auto-scaling-group --cli-input-json file://~/config.json

Di seguito è riportato un esempio del file config.json.

{ "AutoScalingGroupName": "my-asg", "DesiredCapacityType": "units", "MixedInstancesPolicy": { "LaunchTemplate": { "LaunchTemplateSpecification": { "LaunchTemplateName": "my-launch-template", "Version": "$Default" }, "Overrides": [{ "InstanceRequirements": { "VCpuCount": {"Min": 4, "Max": 8}, "MemoryMiB": {"Min": 16384}, "CpuManufacturers": ["intel"] } }] }, "InstancesDistribution": { "OnDemandPercentageAboveBaseCapacity": 50, "SpotAllocationStrategy": "price-capacity-optimized" } }, "MinSize": 0, "MaxSize": 100, "DesiredCapacity": 4, "DesiredCapacityType": "units", "VPCZoneIdentifier": "subnet-5ea0c127,subnet-6194ea3b,subnet-c934b782" }

Per impostare il valore della capacità desiderata come numero vCPUs o quantità di memoria, specificate "DesiredCapacityType": "vcpu" o "DesiredCapacityType": "memory-mib" nel file. Il tipo di capacità di default desiderato è units, che imposta il valore della capacità desiderata come numero di istanze.

In alternativa, è possibile utilizzare il seguente create-auto-scaling-groupcomando per creare il gruppo Auto Scaling. Questo fa riferimento a un YAML file come unico parametro per il gruppo Auto Scaling.

aws autoscaling create-auto-scaling-group --cli-input-yaml file://~/config.yaml

Di seguito è riportato un esempio del file config.yaml.

--- AutoScalingGroupName: my-asg DesiredCapacityType: units MixedInstancesPolicy: LaunchTemplate: LaunchTemplateSpecification: LaunchTemplateName: my-launch-template Version: $Default Overrides: - InstanceRequirements: VCpuCount: Min: 2 Max: 4 MemoryMiB: Min: 2048 CpuManufacturers: - intel InstancesDistribution: OnDemandPercentageAboveBaseCapacity: 50 SpotAllocationStrategy: price-capacity-optimized MinSize: 0 MaxSize: 100 DesiredCapacity: 4 DesiredCapacityType: units VPCZoneIdentifier: subnet-5ea0c127,subnet-6194ea3b,subnet-c934b782

Per impostare il valore della capacità desiderata come numero vCPUs o quantità di memoria, specificate DesiredCapacityType: vcpu o DesiredCapacityType: memory-mib nel file. Il tipo di capacità di default desiderato è units, che imposta il valore della capacità desiderata come numero di istanze.

Visualizza in anteprima i tipi di istanza

È possibile visualizzare in anteprima i tipi di istanza che corrispondono ai requisiti di calcolo senza avviarli e modificare i requisiti, se necessario. Quando crei il gruppo Auto Scaling nella console Amazon Auto EC2 Scaling, viene visualizzata un'anteprima dei tipi di istanza nella sezione Anteprima dei tipi di istanze corrispondenti della pagina Scegli le opzioni di avvio dell'istanza.

In alternativa, puoi visualizzare in anteprima i tipi di istanza effettuando una EC2 GetInstanceTypesFromInstanceRequirementsAPIchiamata Amazon utilizzando AWS CLI o unSDK. Trasferisci i parametri InstanceRequirements nella richiesta nel formato esatto da utilizzare per creare o aggiornare un gruppo con scalabilità automatica. Per ulteriori informazioni, consulta Anteprima dei tipi di istanza con attributi specificati nella Amazon EC2 User Guide.

Per ulteriori informazioni sulla selezione del tipo di istanza basata sugli attributi, consulta Selezione del tipo di istanza basata sugli attributi per Auto Scaling EC2 and Fleet sul blog. EC2 AWS

Puoi dichiarare la selezione del tipo di istanza basata su attributi quando crei un gruppo con dimensionamento automatico usando AWS CloudFormation. Per ulteriori informazioni, consulta lo snippet di esempio nella sezione Snippet del modello di dimensionamento automatico della Guida per l'utente AWS CloudFormation .