Setzen Sie das Training von einem Checkpoint aus fort - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Setzen Sie das Training von einem Checkpoint aus fort

Um einen Trainingsauftrag von einem Kontrollpunkt aus wieder aufzunehmen, führen Sie einen neuen Kalkulator mit denselben checkpoint_s3_uri aus, die Sie im Abschnitt Checkpointing aktivieren erstellt haben. Sobald das Training wieder aufgenommen wurde, werden die Checkpoints aus diesem S3-Bucket in jeder Instance des neuen Trainingsauftrags in checkpoint_local_path wiederhergestellt. Stellen Sie sicher, dass sich der S3-Bucket in derselben Region wie der der aktuellen SageMaker Sitzung befindet.

Architekturdiagramm der Synchronisierung von Checkpoints zur Wiederaufnahme des Trainings.