Zielverfolgung - Amazon Comprehend

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Zielverfolgung

Mit Target Tracking können Sie die Endpunktbereitstellung je nach Nutzung an Ihre Kapazitätsanforderungen anpassen. Die Anzahl der Inferenzeinheiten passt sich automatisch an, sodass die genutzte Kapazität innerhalb eines Zielprozentsatzes der bereitgestellten Kapazität liegt. Sie können Target Tracking verwenden, um einem vorübergehenden Anstieg der Nutzung Ihrer Endpunkte zur Dokumentenklassifizierung und der Entity Recognizer-Endpunkte Rechnung zu tragen. Weitere Informationen finden Sie unter Zielverfolgungs-Skalierungsrichtlinien für Application Auto Scaling.

Anmerkung

Die folgenden Beispiele sind für Unix, Linux und macOS formatiert. Ersetzen Sie unter Windows den umgekehrten Schrägstrich (\), das Unix-Fortsetzungszeichen, am Ende jeder Zeile durch ein Caret-Zeichen oder Zirkumflex (^).

Zielverfolgung einrichten

Um die Zielverfolgung für einen Endpunkt einzurichten, verwenden Sie AWS CLI Befehle, um ein skalierbares Ziel zu registrieren und dann eine Skalierungsrichtlinie zu erstellen. Das skalierbare Ziel definiert Inferenzeinheiten als die Ressource, die zur Anpassung der Endpunktbereitstellung verwendet wird, und die Skalierungsrichtlinie definiert die Metriken, die die auto Skalierung der bereitgestellten Kapazität steuern.

Um die Zielverfolgung einzurichten
  1. Registrieren eines skalierbaren Ziels In den folgenden Beispielen wird ein skalierbares Ziel zur Anpassung der Endpunktbereitstellung mit einer Mindestkapazität von 1 Inferenzeinheit und einer Höchstkapazität von 2 Inferenzeinheiten registriert.

    Verwenden Sie für einen Endpunkt zur Dokumentenklassifizierung den folgenden Befehl: AWS CLI

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2

    Verwenden Sie für einen Entity-Recognizer-Endpunkt den folgenden AWS CLI Befehl:

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2
  2. Verwenden Sie den folgenden AWS CLI Befehl, um die Registrierung des skalierbaren Ziels zu überprüfen:

    aws application-autoscaling describe-scalable-targets \ --service-namespace comprehend \ --resource-id endpoint ARN
  3. Erstellen Sie eine Zielverfolgungskonfiguration für die Skalierungsrichtlinie und speichern Sie die Konfiguration in einer Datei mit dem Namenconfig.json. Im Folgenden finden Sie ein Beispiel für eine Konfiguration zur Zielverfolgung für einen Endpunkt der Dokumentenklassifizierung, bei dem die InferenceUtilization Metrik bei 70% gehalten werden soll.

    { "TargetValue": 70, "CustomizedMetricSpecification": { "MetricName": "InferenceUtilization", "Namespace": "MyNamespace", "Dimensions": [ { "Name": "EndpointArn", "Value": "arn:aws:comprehend:region:account-id:document-classifier-endpoint/name" } ], "Statistic": "Sum", "Unit": "Percent" } }

    Das Folgende ist ein Beispiel für einen Entity-Recognizer-Endpunkt:

    { "TargetValue": 70, "CustomizedMetricSpecification": { "MetricName": "InferenceUtilization", "Namespace": "MyNamespace", "Dimensions": [ { "Name": "EndpointArn", "Value": "arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name" } ], "Statistic": "Sum", "Unit": "Percent" } }
  4. Erstellen Sie eine Skalierungsrichtlinie. In den folgenden Beispielen wird eine Skalierungsrichtlinie erstellt, die auf der in der config.json Datei definierten Zielverfolgungskonfiguration basiert.

    Verwenden Sie für einen Endpunkt zur Dokumentenklassifizierung den folgenden AWS CLI Befehl:

    aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json

    Verwenden Sie für einen Entity-Recognizer-Endpunkt den folgenden AWS CLI Befehl:

    aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json

Überlegungen

Bei der Verwendung von Target Tracking mit Comprehend-Endpunkten gelten die folgenden Überlegungen:

  • Endpunktmetriken werden nur bei erfolgreichen Anfragen ausgegeben. Metriken werden nicht für Anfragen angezeigt, die gedrosselt wurden oder aufgrund eines internen Serverfehlers oder eines Kundenfehlers fehlschlagen.

  • Wenn Datenpunkte fehlen, ändert sich der Status des CloudWatch Hintergrundalarms auf. INSUFFICIENT_DATA In diesem Fall kann Application Auto Scaling Ihren Endpunkt nicht skalieren.

  • Metrische Mathematik kann hilfreich sein, um diese Einschränkung zu umgehen. Um beispielsweise den Wert 0 zu verwenden, wenn keine Metrik gemeldet wird, verwenden Sie die FILL(m1,0) Funktion where m1 is the metric. Es ist wichtig, dass Sie Ihre Konfiguration testen, um sicherzustellen, dass sie sich wie erwartet verhält. Weitere Optionen finden Sie unter Erstellen von Richtlinien zur Zielverfolgung mithilfe von metrischen Berechnungen.

Zielverfolgung entfernen

Um die Zielverfolgung für einen Endpunkt zu entfernen, verwenden Sie AWS CLI Befehle, um die Skalierungsrichtlinie zu löschen und anschließend das skalierbare Ziel zu deregistrieren.

Um die Zielverfolgung zu entfernen
  1. Löschen Sie die Skalierungsrichtlinie. In den folgenden Beispielen wird eine angegebene Skalierungsrichtlinie gelöscht.

    Verwenden Sie für einen Endpunkt zur Dokumentenklassifizierung den folgenden AWS CLI Befehl:

    aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \

    Verwenden Sie für einen Entity-Recognizer-Endpunkt den folgenden AWS CLI Befehl:

    aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy
  2. Melden Sie das skalierbare Ziel ab. In den folgenden Beispielen wird die Registrierung eines angegebenen skalierbaren Ziels aufgehoben.

    Verwenden Sie für einen Endpunkt zur Dokumentenklassifizierung den folgenden Befehl: AWS CLI

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits

    Verwenden Sie für einen Entity-Recognizer-Endpunkt den folgenden AWS CLI Befehl:

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits