Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Beheben von Problemen mit Inferenz-Pipelines
Verwenden Sie CloudWatch Protokolle und Fehlermeldungen, um Probleme mit der Inferenzpipeline zu beheben. Wenn Sie benutzerdefinierte Docker-Images in einer Pipeline verwenden, die SageMaker integrierte Amazon-Algorithmen enthält, können auch Berechtigungsprobleme auftreten. Um die erforderlichen Berechtigungen zu gewähren, erstellen Sie eine Amazon Elastic Container Registry (AmazonECR) -Richtlinie.
Themen
Problembehandlung bei Amazon ECR Permissions for Inference Pipelines
Wenn Sie benutzerdefinierte Docker-Images in einer Pipeline verwenden, die SageMaker integrierte Algorithmen enthält, benötigen Sie eine ECRAmazon-Richtlinie. Die Richtlinie ermöglicht es Ihrem ECR Amazon-Repository, die Erlaubnis SageMaker zum Abrufen des Images zu erteilen. Die Richtlinie muss die folgenden Berechtigungen hinzufügen:
{ "Version": "2008-10-17", "Statement": [ { "Sid": "allowSageMakerToPull", "Effect": "Allow", "Principal": { "Service": "sagemaker.amazonaws.com" }, "Action": [ "ecr:GetDownloadUrlForLayer", "ecr:BatchGetImage", "ecr:BatchCheckLayerAvailability" ] } ] }
Verwenden Sie CloudWatch Protokolle zur Fehlerbehebung bei SageMaker Inferenz-Pipelines
SageMaker veröffentlicht die Container-Logs für Endpunkte, die eine Inferenz-Pipeline für Amazon bereitstellen, CloudWatch unter dem folgenden Pfad für jeden Container.
/aws/sagemaker/Endpoints/{EndpointName}/{Variant}/{InstanceId}/{ContainerHostname}
Beispiel: Protokolle für diesen Endpunkt werden in den folgenden Protokollgruppen und Streams veröffentlicht:
EndpointName: MyInferencePipelinesEndpoint Variant: MyInferencePipelinesVariant InstanceId: i-0179208609ff7e488 ContainerHostname: MyContainerName1 and MyContainerName2
logGroup: /aws/sagemaker/Endpoints/MyInferencePipelinesEndpoint logStream: MyInferencePipelinesVariant/i-0179208609ff7e488/MyContainerName1 logStream: MyInferencePipelinesVariant/i-0179208609ff7e488/MyContainerName2
Ein Protokollstream ist eine Abfolge von Protokollereignissen, die dieselbe Quelle nutzen. Jede einzelne Logquelle CloudWatch bildet einen separaten Log-Stream. Eine Protokollgruppe ist eine Gruppe von Protokollstreams, die dieselben Einstellungen für die Aufbewahrung, Überwachung und Zugriffskontrolle besitzen.
Anzeigen der Protokollgruppen und -streams
Öffnen Sie die CloudWatch Konsole unter https://console.aws.amazon.com/cloudwatch/
. -
Wählen Sie auf der Navigationsseite Logs (Protokolle).
-
Filtern Sie unter Log Groups (Protokollgruppen) nach
MyInferencePipelinesEndpoint
: -
Um die Protokollstreams anzuzeigen, wählen Sie
MyInferencePipelinesEndpoint
auf der Seite CloudWatch Protokollgruppen die Option Protokollgruppe suchen aus.
Eine Liste der Protokolle, die SageMaker veröffentlicht werden, finden Sie unterProtokolle und Metriken der Inferenz-Pipeline.
Verwenden von Fehlermeldungen zum Beheben von Problemen mit Inferenz-Pipelines.
Die Inferenz-Pipeline-Fehlermeldungen geben an, welcher Container fehlgeschlagen ist.
Wenn beim Aufrufen eines Endpunkts ein Fehler auftritt, gibt der Dienst einen Fehler zurück ModelError
(Fehlercode 424), der angibt, welcher Container ausgefallen SageMaker ist. Wenn die Nutzlast der Anfrage (die Antwort des vorherigen Containers) das Limit von 5 MB überschreitet, wird eine SageMaker detaillierte Fehlermeldung angezeigt, z. B.:
Antwort von MyContainerName 1 mit Statuscode 200 erhalten. Die Anforderungsnutzlast von MyContainerName 1 bis MyContainerName 2 beträgt jedoch 6000000 Byte, was die maximale Grenze von 5 MB überschritten hat.
Wenn ein Container die Ping-Integritätsprüfung beim Erstellen eines Endpunkts nicht SageMaker besteht, gibt er a zurück ClientError
und gibt alle Container an, die die Ping-Überprüfung bei der letzten Integritätsprüfung nicht bestanden haben.