Monitoraggio degli obiettivi - Amazon Comprehend

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Monitoraggio degli obiettivi

Con il monitoraggio degli obiettivi, puoi adattare il provisioning degli endpoint alle tue esigenze di capacità in base all'utilizzo. Il numero di unità di inferenza si regola automaticamente in modo che la capacità utilizzata rientri nella percentuale target della capacità fornita. È possibile utilizzare il monitoraggio degli obiettivi per far fronte a picchi temporanei di utilizzo degli endpoint di classificazione dei documenti e degli endpoint di riconoscimento delle entità. Per ulteriori informazioni, consulta Policy di dimensionamento con monitoraggio degli obiettivi per Application Auto Scaling.

Nota

I seguenti esempi sono formattati per Unix, Linux e macOS. Per Windows, sostituisci il carattere di continuazione UNIX barra rovesciata (\) al termine di ogni riga con un accento circonflesso (^).

Configurazione del tracciamento degli obiettivi

Per configurare il tracciamento delle destinazioni per un endpoint, si utilizzano AWS i comandi CLI per registrare un target scalabile e quindi creare una politica di scalabilità. Il target scalabile definisce le unità di inferenza come risorsa utilizzata per regolare il provisioning degli endpoint e la policy di scalabilità definisce le metriche che controllano la scalabilità automatica della capacità fornita.

Per impostare il tracciamento degli obiettivi
  1. Registrazione di una destinazione dimensionabile. Gli esempi seguenti registrano un target scalabile per regolare il provisioning degli endpoint con una capacità minima di 1 unità di inferenza e una capacità massima di 2 unità di inferenza.

    Per un endpoint di classificazione dei documenti, utilizzate il seguente comando AWS CLI:

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2

    Per un endpoint di riconoscimento delle entità, usa il seguente comando CLI: AWS

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2
  2. Per verificare la registrazione del target scalabile, utilizza il seguente comando AWS CLI:

    aws application-autoscaling describe-scalable-targets \ --service-namespace comprehend \ --resource-id endpoint ARN
  3. Crea una configurazione di tracciamento della destinazione per la politica di ridimensionamento e salva la configurazione in un file chiamato. config.json Di seguito è riportato un esempio di configurazione di tracciamento degli obiettivi per un endpoint di classificazione dei documenti che mira a mantenere la InferenceUtilization metrica al 70%.

    { "TargetValue": 70, "CustomizedMetricSpecification": { "MetricName": "InferenceUtilization", "Namespace": "MyNamespace", "Dimensions": [ { "Name": "EndpointArn", "Value": "arn:aws:comprehend:region:account-id:document-classifier-endpoint/name" } ], "Statistic": "Sum", "Unit": "Percent" } }

    Di seguito è riportato un esempio di endpoint di riconoscimento delle entità:

    { "TargetValue": 70, "CustomizedMetricSpecification": { "MetricName": "InferenceUtilization", "Namespace": "MyNamespace", "Dimensions": [ { "Name": "EndpointArn", "Value": "arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name" } ], "Statistic": "Sum", "Unit": "Percent" } }
  4. Crea una politica di scalabilità. Gli esempi seguenti creano una politica di scalabilità basata sulla configurazione di tracciamento del target definita nel config.json file.

    Per un endpoint di classificazione dei documenti, utilizzate il seguente comando AWS CLI:

    aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json

    Per un endpoint di riconoscimento delle entità, usa il seguente comando CLI: AWS

    aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json

Considerazioni

Le seguenti considerazioni si applicano quando si utilizza il tracciamento del target con gli endpoint Comprehend:

  • Le metriche degli endpoint vengono emesse solo per le richieste riuscite. Le metriche non verranno visualizzate per le richieste limitate o non riuscite a causa di un errore interno del server o di un errore del cliente.

  • Quando mancano i punti dati, lo stato di CloudWatch allarme di backup cambierà in. INSUFFICIENT_DATA Quando ciò accade, Application Auto Scaling non è in grado di scalare l'endpoint.

  • La matematica metrica può essere utile per aggirare questa limitazione. Ad esempio, per utilizzare il valore 0 quando non viene riportata alcuna metrica, utilizzate la FILL(m1,0) funzione where m1 is the metric. È importante testare la configurazione per assicurarsi che si comporti come previsto. Per ulteriori opzioni, consulta Creazione di politiche di tracciamento degli obiettivi utilizzando la matematica delle metriche.

Rimuovere il tracciamento degli obiettivi

Per rimuovere il tracciamento delle destinazioni per un endpoint, si utilizzano AWS i comandi CLI per eliminare la politica di scalabilità e quindi annullare la registrazione della destinazione scalabile.

Per rimuovere il tracciamento degli obiettivi
  1. Elimina la politica di scalabilità. Gli esempi seguenti eliminano una politica di ridimensionamento specificata.

    Per un endpoint di classificazione dei documenti, utilizzate il seguente comando AWS CLI:

    aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \

    Per un endpoint di riconoscimento delle entità, usa il seguente comando CLI: AWS

    aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy
  2. Annullare la registrazione di una destinazione scalabile. I seguenti esempi annullano la registrazione di un target scalabile specificato.

    Per un endpoint di classificazione dei documenti, utilizzate il seguente comando AWS CLI:

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits

    Per un endpoint di riconoscimento delle entità, usa il seguente comando CLI: AWS

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits