Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Monitoraggio degli obiettivi
Con il monitoraggio degli obiettivi, puoi adattare il provisioning degli endpoint alle tue esigenze di capacità in base all'utilizzo. Il numero di unità di inferenza si regola automaticamente in modo che la capacità utilizzata rientri nella percentuale target della capacità fornita. È possibile utilizzare il monitoraggio degli obiettivi per far fronte a picchi temporanei di utilizzo degli endpoint di classificazione dei documenti e degli endpoint di riconoscimento delle entità. Per ulteriori informazioni, consulta Policy di dimensionamento con monitoraggio degli obiettivi per Application Auto Scaling.
Nota
I seguenti esempi sono formattati per Unix, Linux e macOS. Per Windows, sostituisci il carattere di continuazione UNIX barra rovesciata (\) al termine di ogni riga con un accento circonflesso (^).
Configurazione del tracciamento degli obiettivi
Per configurare il tracciamento delle destinazioni per un endpoint, si utilizzano AWS i comandi CLI per registrare un target scalabile e quindi creare una politica di scalabilità. Il target scalabile definisce le unità di inferenza come risorsa utilizzata per regolare il provisioning degli endpoint e la policy di scalabilità definisce le metriche che controllano la scalabilità automatica della capacità fornita.
Per impostare il tracciamento degli obiettivi
-
Registrazione di una destinazione dimensionabile. Gli esempi seguenti registrano un target scalabile per regolare il provisioning degli endpoint con una capacità minima di 1 unità di inferenza e una capacità massima di 2 unità di inferenza.
Per un endpoint di classificazione dei documenti, utilizzate il seguente comando AWS CLI:
aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:document-classifier-endpoint/name
\ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2Per un endpoint di riconoscimento delle entità, usa il seguente comando CLI: AWS
aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:entity-recognizer-endpoint/name
\ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2 -
Per verificare la registrazione del target scalabile, utilizza il seguente comando AWS CLI:
aws application-autoscaling describe-scalable-targets \ --service-namespace comprehend \ --resource-id
endpoint ARN
-
Crea una configurazione di tracciamento della destinazione per la politica di ridimensionamento e salva la configurazione in un file chiamato.
config.json
Di seguito è riportato un esempio di configurazione di tracciamento degli obiettivi per un endpoint di classificazione dei documenti che mira a mantenere la InferenceUtilization metrica al 70%.{ "TargetValue": 70, "CustomizedMetricSpecification": { "MetricName": "InferenceUtilization", "Namespace": "MyNamespace", "Dimensions": [ { "Name": "EndpointArn", "Value": "arn:aws:comprehend:
region
:account-id
:document-classifier-endpoint/name
" } ], "Statistic": "Sum", "Unit": "Percent" } }Di seguito è riportato un esempio di endpoint di riconoscimento delle entità:
{ "TargetValue": 70, "CustomizedMetricSpecification": { "MetricName": "InferenceUtilization", "Namespace": "MyNamespace", "Dimensions": [ { "Name": "EndpointArn", "Value": "arn:aws:comprehend:
region
:account-id
:entity-recognizer-endpoint/name
" } ], "Statistic": "Sum", "Unit": "Percent" } } -
Crea una politica di scalabilità. Gli esempi seguenti creano una politica di scalabilità basata sulla configurazione di tracciamento del target definita nel
config.json
file.Per un endpoint di classificazione dei documenti, utilizzate il seguente comando AWS CLI:
aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:document-classifier-endpoint/name
\ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-nameTestPolicy
\ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.jsonPer un endpoint di riconoscimento delle entità, usa il seguente comando CLI: AWS
aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:entity-recognizer-endpoint/name
\ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-nameTestPolicy
\ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json
Considerazioni
Le seguenti considerazioni si applicano quando si utilizza il tracciamento del target con gli endpoint Comprehend:
-
Le metriche degli endpoint vengono emesse solo per le richieste riuscite. Le metriche non verranno visualizzate per le richieste limitate o non riuscite a causa di un errore interno del server o di un errore del cliente.
-
Quando mancano i punti dati, lo stato di CloudWatch allarme di backup cambierà in.
INSUFFICIENT_DATA
Quando ciò accade, Application Auto Scaling non è in grado di scalare l'endpoint. -
La matematica metrica può essere utile per aggirare questa limitazione. Ad esempio, per utilizzare il valore 0 quando non viene riportata alcuna metrica, utilizzate la
FILL(m1,0)
funzione wherem1
is the metric. È importante testare la configurazione per assicurarsi che si comporti come previsto. Per ulteriori opzioni, consulta Creazione di politiche di tracciamento degli obiettivi utilizzando la matematica delle metriche.
Rimuovere il tracciamento degli obiettivi
Per rimuovere il tracciamento delle destinazioni per un endpoint, si utilizzano AWS i comandi CLI per eliminare la politica di scalabilità e quindi annullare la registrazione della destinazione scalabile.
Per rimuovere il tracciamento degli obiettivi
-
Elimina la politica di scalabilità. Gli esempi seguenti eliminano una politica di ridimensionamento specificata.
Per un endpoint di classificazione dei documenti, utilizzate il seguente comando AWS CLI:
aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:document-classifier-endpoint/name
\ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-nameTestPolicy
\Per un endpoint di riconoscimento delle entità, usa il seguente comando CLI: AWS
aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:entity-recognizer-endpoint/name
\ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-nameTestPolicy
-
Annullare la registrazione di una destinazione scalabile. I seguenti esempi annullano la registrazione di un target scalabile specificato.
Per un endpoint di classificazione dei documenti, utilizzate il seguente comando AWS CLI:
aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:document-classifier-endpoint/name
\ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnitsPer un endpoint di riconoscimento delle entità, usa il seguente comando CLI: AWS
aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:entity-recognizer-endpoint/name
\ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits