SageMaker Debugger zum Speichern von Tensoren konfigurieren

Tensoren sind Datensammlungen aktualisierter Parameter aus dem Rückwärts- und Vorwärtsdurchlauf jeder Trainingsiteration. SageMaker Der Debugger sammelt die Ausgabetensoren, um den Status eines Trainingsjobs zu analysieren. SageMaker Debugger CollectionConfigund DebuggerHookConfigAPIOperationen bieten Methoden zum Gruppieren von Tensoren in Sammlungen und zum Speichern in einem Ziel-S3-Bucket. Die folgenden Themen zeigen, wie die DebuggerHookConfig API Operationen CollectionConfig und verwendet werden, gefolgt von Beispielen zur Verwendung des Debugger-Hooks zum Speichern, Zugreifen und Visualisieren von Ausgabetensoren.

Aktivieren Sie beim Erstellen eines SageMaker Schätzers den SageMaker Debugger, indem Sie den Parameter angeben. debugger_hook_config Die folgenden Themen enthalten Beispiele dafür, wie Sie die DebuggerHookConfig API Operationen „CollectionConfigund“ einrichten, debugger_hook_config mit denen Sie Tensoren aus Ihren Trainingsaufgaben herausziehen und speichern können.

Anmerkung

Nach der ordnungsgemäßen Konfiguration und Aktivierung speichert der SageMaker Debugger die Ausgabetensoren in einem Standard-S3-Bucket, sofern nicht anders angegeben. Das Format des Standard-S3-Buckets URI ist. s3://sagemaker-<region>-<12digit_account_id>/<training-job-name>/debug-output/

Themen

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Starten Sie Trainingsjobs mit dem Debugger mithilfe von Python SageMaker SDK

Tensor-Sammlungen konfigurieren