Beheben von Problemen mit Inferenz-Pipelines - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Beheben von Problemen mit Inferenz-Pipelines

Verwenden Sie CloudWatch Protokolle und Fehlermeldungen, um Probleme mit der Inferenzpipeline zu beheben. Wenn Sie benutzerdefinierte Docker-Images in einer Pipeline verwenden, die SageMaker integrierte Amazon-Algorithmen enthält, können auch Berechtigungsprobleme auftreten. Um die erforderlichen Berechtigungen zu gewähren, erstellen Sie eine Amazon Elastic Container Registry (AmazonECR) -Richtlinie.

Problembehandlung bei Amazon ECR Permissions for Inference Pipelines

Wenn Sie benutzerdefinierte Docker-Images in einer Pipeline verwenden, die SageMaker integrierte Algorithmen enthält, benötigen Sie eine ECRAmazon-Richtlinie. Die Richtlinie ermöglicht es Ihrem ECR Amazon-Repository, die Erlaubnis SageMaker zum Abrufen des Images zu erteilen. Die Richtlinie muss die folgenden Berechtigungen hinzufügen:

{ "Version": "2008-10-17", "Statement": [ { "Sid": "allowSageMakerToPull", "Effect": "Allow", "Principal": { "Service": "sagemaker.amazonaws.com" }, "Action": [ "ecr:GetDownloadUrlForLayer", "ecr:BatchGetImage", "ecr:BatchCheckLayerAvailability" ] } ] }

Verwenden Sie CloudWatch Protokolle zur Fehlerbehebung bei SageMaker Inferenz-Pipelines

SageMaker veröffentlicht die Container-Logs für Endpunkte, die eine Inferenz-Pipeline für Amazon bereitstellen, CloudWatch unter dem folgenden Pfad für jeden Container.

/aws/sagemaker/Endpoints/{EndpointName}/{Variant}/{InstanceId}/{ContainerHostname}

Beispiel: Protokolle für diesen Endpunkt werden in den folgenden Protokollgruppen und Streams veröffentlicht:

EndpointName: MyInferencePipelinesEndpoint Variant: MyInferencePipelinesVariant InstanceId: i-0179208609ff7e488 ContainerHostname: MyContainerName1 and MyContainerName2
logGroup: /aws/sagemaker/Endpoints/MyInferencePipelinesEndpoint logStream: MyInferencePipelinesVariant/i-0179208609ff7e488/MyContainerName1 logStream: MyInferencePipelinesVariant/i-0179208609ff7e488/MyContainerName2

Ein Protokollstream ist eine Abfolge von Protokollereignissen, die dieselbe Quelle nutzen. Jede einzelne Logquelle CloudWatch bildet einen separaten Log-Stream. Eine Protokollgruppe ist eine Gruppe von Protokollstreams, die dieselben Einstellungen für die Aufbewahrung, Überwachung und Zugriffskontrolle besitzen.

Anzeigen der Protokollgruppen und -streams
  1. Öffnen Sie die CloudWatch Konsole unter https://console.aws.amazon.com/cloudwatch/.

  2. Wählen Sie auf der Navigationsseite Logs (Protokolle).

  3. Filtern Sie unter Log Groups (Protokollgruppen) nach MyInferencePipelinesEndpoint:

    Die CloudWatch Protokollgruppen wurden nach dem Endpunkt der Inferenzpipeline gefiltert.
  4. Um die Protokollstreams anzuzeigen, wählen Sie MyInferencePipelinesEndpoint auf der Seite CloudWatch Protokollgruppen die Option Protokollgruppe suchen aus.

    Der CloudWatch Log-Stream für die Inferenz-Pipeline.

Eine Liste der Protokolle, die SageMaker veröffentlicht werden, finden Sie unterProtokolle und Metriken der Inferenz-Pipeline.

Verwenden von Fehlermeldungen zum Beheben von Problemen mit Inferenz-Pipelines.

Die Inferenz-Pipeline-Fehlermeldungen geben an, welcher Container fehlgeschlagen ist.

Wenn beim Aufrufen eines Endpunkts ein Fehler auftritt, gibt der Dienst einen Fehler zurück ModelError (Fehlercode 424), der angibt, welcher Container ausgefallen SageMaker ist. Wenn die Nutzlast der Anfrage (die Antwort des vorherigen Containers) das Limit von 5 MB überschreitet, wird eine SageMaker detaillierte Fehlermeldung angezeigt, z. B.:

Es wurde eine Antwort von MyContainerName 1 mit dem Statuscode 200 empfangen. Die Anforderungsnutzlast von MyContainerName 1 bis MyContainerName 2 beträgt jedoch 6000000 Byte, was die maximale Grenze von 5 MB überschritten hat.

Wenn ein Container die Ping-Integritätsprüfung beim Erstellen eines Endpunkts nicht SageMaker besteht, gibt er a zurück ClientError und gibt alle Container an, die die Ping-Überprüfung bei der letzten Integritätsprüfung nicht bestanden haben.