Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Zielverfolgung
Mit Target Tracking können Sie die Endpunktbereitstellung je nach Nutzung an Ihre Kapazitätsanforderungen anpassen. Die Anzahl der Inferenzeinheiten passt sich automatisch an, sodass die genutzte Kapazität innerhalb eines Zielprozentsatzes der bereitgestellten Kapazität liegt. Sie können Target Tracking verwenden, um einem vorübergehenden Anstieg der Nutzung Ihrer Endpunkte zur Dokumentenklassifizierung und der Entity Recognizer-Endpunkte Rechnung zu tragen. Weitere Informationen finden Sie unter Zielverfolgungs-Skalierungsrichtlinien für Application Auto Scaling.
Anmerkung
Die folgenden Beispiele sind für Unix, Linux und macOS formatiert. Ersetzen Sie unter Windows den umgekehrten Schrägstrich (\), das Unix-Fortsetzungszeichen, am Ende jeder Zeile durch ein Caret-Zeichen oder Zirkumflex (^).
Zielverfolgung einrichten
Um die Zielverfolgung für einen Endpunkt einzurichten, verwenden Sie AWS CLI Befehle, um ein skalierbares Ziel zu registrieren und dann eine Skalierungsrichtlinie zu erstellen. Das skalierbare Ziel definiert Inferenzeinheiten als die Ressource, die zur Anpassung der Endpunktbereitstellung verwendet wird, und die Skalierungsrichtlinie definiert die Metriken, die die auto Skalierung der bereitgestellten Kapazität steuern.
Um die Zielverfolgung einzurichten
-
Registrieren eines skalierbaren Ziels In den folgenden Beispielen wird ein skalierbares Ziel zur Anpassung der Endpunktbereitstellung mit einer Mindestkapazität von 1 Inferenzeinheit und einer Höchstkapazität von 2 Inferenzeinheiten registriert.
Verwenden Sie für einen Endpunkt zur Dokumentenklassifizierung den folgenden Befehl: AWS CLI
aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:document-classifier-endpoint/name
\ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2Verwenden Sie für einen Entity-Recognizer-Endpunkt den folgenden AWS CLI Befehl:
aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:entity-recognizer-endpoint/name
\ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2 -
Verwenden Sie den folgenden AWS CLI Befehl, um die Registrierung des skalierbaren Ziels zu überprüfen:
aws application-autoscaling describe-scalable-targets \ --service-namespace comprehend \ --resource-id
endpoint ARN
-
Erstellen Sie eine Zielverfolgungskonfiguration für die Skalierungsrichtlinie und speichern Sie die Konfiguration in einer Datei mit dem Namen
config.json
. Im Folgenden finden Sie ein Beispiel für eine Konfiguration zur Zielverfolgung für einen Endpunkt der Dokumentenklassifizierung, bei dem die InferenceUtilization Metrik bei 70% gehalten werden soll.{ "TargetValue": 70, "CustomizedMetricSpecification": { "MetricName": "InferenceUtilization", "Namespace": "MyNamespace", "Dimensions": [ { "Name": "EndpointArn", "Value": "arn:aws:comprehend:
region
:account-id
:document-classifier-endpoint/name
" } ], "Statistic": "Sum", "Unit": "Percent" } }Das Folgende ist ein Beispiel für einen Entity-Recognizer-Endpunkt:
{ "TargetValue": 70, "CustomizedMetricSpecification": { "MetricName": "InferenceUtilization", "Namespace": "MyNamespace", "Dimensions": [ { "Name": "EndpointArn", "Value": "arn:aws:comprehend:
region
:account-id
:entity-recognizer-endpoint/name
" } ], "Statistic": "Sum", "Unit": "Percent" } } -
Erstellen Sie eine Skalierungsrichtlinie. In den folgenden Beispielen wird eine Skalierungsrichtlinie erstellt, die auf der in der
config.json
Datei definierten Zielverfolgungskonfiguration basiert.Verwenden Sie für einen Endpunkt zur Dokumentenklassifizierung den folgenden AWS CLI Befehl:
aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:document-classifier-endpoint/name
\ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-nameTestPolicy
\ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.jsonVerwenden Sie für einen Entity-Recognizer-Endpunkt den folgenden AWS CLI Befehl:
aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:entity-recognizer-endpoint/name
\ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-nameTestPolicy
\ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json
Überlegungen
Bei der Verwendung von Target Tracking mit Comprehend-Endpunkten gelten die folgenden Überlegungen:
-
Endpunktmetriken werden nur bei erfolgreichen Anfragen ausgegeben. Metriken werden nicht für Anfragen angezeigt, die gedrosselt wurden oder aufgrund eines internen Serverfehlers oder eines Kundenfehlers fehlschlagen.
-
Wenn Datenpunkte fehlen, ändert sich der Status des CloudWatch Hintergrundalarms auf.
INSUFFICIENT_DATA
In diesem Fall kann Application Auto Scaling Ihren Endpunkt nicht skalieren. -
Metrische Mathematik kann hilfreich sein, um diese Einschränkung zu umgehen. Um beispielsweise den Wert 0 zu verwenden, wenn keine Metrik gemeldet wird, verwenden Sie die
FILL(m1,0)
Funktion wherem1
is the metric. Es ist wichtig, dass Sie Ihre Konfiguration testen, um sicherzustellen, dass sie sich wie erwartet verhält. Weitere Optionen finden Sie unter Erstellen von Richtlinien zur Zielverfolgung mithilfe von metrischen Berechnungen.
Zielverfolgung entfernen
Um die Zielverfolgung für einen Endpunkt zu entfernen, verwenden Sie AWS CLI Befehle, um die Skalierungsrichtlinie zu löschen und anschließend das skalierbare Ziel zu deregistrieren.
Um die Zielverfolgung zu entfernen
-
Löschen Sie die Skalierungsrichtlinie. In den folgenden Beispielen wird eine angegebene Skalierungsrichtlinie gelöscht.
Verwenden Sie für einen Endpunkt zur Dokumentenklassifizierung den folgenden AWS CLI Befehl:
aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:document-classifier-endpoint/name
\ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-nameTestPolicy
\Verwenden Sie für einen Entity-Recognizer-Endpunkt den folgenden AWS CLI Befehl:
aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:entity-recognizer-endpoint/name
\ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-nameTestPolicy
-
Melden Sie das skalierbare Ziel ab. In den folgenden Beispielen wird die Registrierung eines angegebenen skalierbaren Ziels aufgehoben.
Verwenden Sie für einen Endpunkt zur Dokumentenklassifizierung den folgenden Befehl: AWS CLI
aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:document-classifier-endpoint/name
\ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnitsVerwenden Sie für einen Entity-Recognizer-Endpunkt den folgenden AWS CLI Befehl:
aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:entity-recognizer-endpoint/name
\ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits