Verfügbare Optionen - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verfügbare Optionen

Die folgende Tabelle zeigt alle verfügbaren Optionen, mit denen Sie Ihren Notebook-Job anpassen können, unabhängig davon, ob Sie Ihren Notebook-Job in Studio, einer lokalen Jupyter-Umgebung oder mit Python ausführen. SageMaker SDK Die Tabelle enthält den Typ der benutzerdefinierten Option, eine Beschreibung, zusätzliche Richtlinien zur Verwendung der Option, einen Feldnamen für die Option in Studio (falls verfügbar) und den Parameternamen für den Notebook-Jobschritt in SageMaker Python SDK (falls verfügbar).

Für einige Optionen können Sie auch benutzerdefinierte Standardwerte voreinstellen, sodass Sie sie nicht jedes Mal angeben müssen, wenn Sie einen Notizbuchjob einrichten. Für Studio lauten diese Optionen Rolle, Eingabeordner, Ausgabeordner und KMSSchlüssel-ID. Sie sind in der folgenden Tabelle angegeben. Wenn Sie benutzerdefinierte Standardeinstellungen für diese Optionen voreinstellen, werden diese Felder im Formular „Job erstellen“ automatisch ausgefüllt, wenn Sie Ihren Notizbuchauftrag erstellen. Einzelheiten zum Erstellen benutzerdefinierter Standardeinstellungen in Studio und lokalen Jupyter-Umgebungen finden Sie unter. Richten Sie Standardoptionen für lokale Notebooks ein

Das bietet Ihnen SageMaker SDK auch die Möglichkeit, intelligente Standardeinstellungen festzulegen, sodass Sie diese Parameter nicht angeben müssen, wenn Sie eine erstellen. NotebookJobStep Diese Parameter sindrole,s3_root_uri,s3_kms_key,volume_kms_key, subnetssecurity_group_ids, und sind in der folgenden Tabelle angegeben. Informationen zum Einstellen intelligenter Standardeinstellungen finden Sie unterRichten Sie Standardoptionen ein.

Benutzerdefinierte Option Beschreibung Studiospezifische Richtlinie Richtlinie für lokale Jupyter-Umgebungen SageMaker SDKPython-Richtlinie
Job name (Auftragsname) Ihr Jobname, so wie er im Notebook Jobs-Dashboard erscheinen sollte. Feld Jobname. Wie Studio. Parameternotebook_job_name. Standardeinstellung: None.
Image Das Container-Image, das verwendet wurde, um das Notebook nicht interaktiv auf dem ausgewählten Compute-Typ auszuführen. Bild des Feldes. In diesem Feld wird standardmäßig das aktuelle Bild Ihres Notebooks verwendet. Ändern Sie dieses Feld bei Bedarf vom Standardwert in einen benutzerdefinierten Wert. Wenn Studio diesen Wert nicht ableiten kann, zeigt das Formular einen Validierungsfehler an, in dem Sie ihn angeben müssen. Bei diesem Bild kann es sich um ein benutzerdefiniertes bring-your-own Bild, ein Bild oder ein verfügbares SageMaker Amazon-Bild handeln. Eine Liste der verfügbaren SageMaker Bilder, die vom Notebook-Scheduler unterstützt werden, finden Sie unter SageMaker Amazon-Bilder sind für die Verwendung mit Studio Classic verfügbar. Bild im Feld. Für dieses Feld ist ein ECR URI Docker-Image erforderlich, mit dem das bereitgestellte Notebook auf dem ausgewählten Compute-Typ ausgeführt werden kann. Standardmäßig verwendet die Scheduler-Erweiterung ein vorgefertigtes SageMaker Docker-Image-Basis-Python 2.0. Dies ist das offizielle Python 3.8-Image von DockerHub boto3, AWS CLI, und dem Python 3-Kernel. Sie können auch jedes bereitstellen ECRURI, das der Spezifikation für benutzerdefinierte Notebooks entspricht. Details hierzu finden Sie unter Benutzerdefinierte SageMaker Bildspezifikationen. Dieses Image sollte alle Kernel und Bibliotheken enthalten, die für die Ausführung des Notebooks benötigt werden. Pflichtfeld Parameterimage_uri. URISpeicherort eines Docker-Images aufECR. Sie können spezielle SageMaker Distributions-Images oder ein auf diesen Images basierendes benutzerdefiniertes Image oder Ihr eigenes Image mit vorinstallierten Notebook-Job-Abhängigkeiten verwenden, das zusätzliche Anforderungen erfüllt. Details hierzu finden Sie unter Bildeinschränkungen für SageMaker SDK Python-Notebook-Jobs.
Instance-Typ Der EC2 Instanztyp, der zur Ausführung des Notebook-Jobs verwendet werden soll. Der Notebook-Job verwendet einen SageMaker Trainingsjob als Rechenschicht, daher sollte es sich bei dem angegebenen Instance-Typ um einen vom SageMaker Training unterstützten Instance-Typ handeln. Feld-Berechnungstyp. Standardeinstellung: ml.m5.large. Wie Studio. Parameterinstance_type. Standardeinstellung: ml.m5.large.
Kernel Der Jupyter-Kernel, der zur Ausführung des Notebook-Aufträge verwendet wurde. Feld Kernel. Dieses Feld ist standardmäßig auf den aktuellen Kernel Ihres Notebooks eingestellt. Ändern Sie dieses Feld bei Bedarf vom Standardwert in einen benutzerdefinierten Wert. Wenn Studio diesen Wert nicht ableiten kann, zeigt das Formular einen Validierungsfehler an, in dem Sie ihn angeben müssen. Feld-Kernel. Dieser Kernel sollte im Image vorhanden sein und den Jupyter-Kernelspezifikationen entsprechen. Dieses Feld ist standardmäßig auf den Python3-Kernel eingestellt, der sich im Python 2.0-Basisimage befindet. SageMaker Ändern Sie dieses Feld bei Bedarf in einen benutzerdefinierten Wert. Pflichtfeld Parameter. kernel_name Dieser Kernel sollte im Image vorhanden sein und den Jupyter-Kernelspezifikationen entsprechen. Die Kernel-Identifikatoren für Ihr Image finden Sie unter (LINK).
SageMaker Sitzung Die zugrunde liegende SageMaker Sitzung, an die SageMaker Serviceanrufe delegiert werden. N/A N/A Parametersagemaker_session. Falls nicht angegeben, wird einer mithilfe einer Standardkonfigurationskette erstellt.
Rolle ARN Der Amazon-Ressourcenname (ARN) der Rolle, der für den Notebook-Job verwendet wird. Feldrolle ARN. Dieses Feld ist standardmäßig auf die Studio-Ausführungsrolle eingestellt. Ändern Sie dieses Feld bei Bedarf in einen benutzerdefinierten Wert.
Anmerkung

Wenn Studio diesen Wert nicht ableiten kann, ist das ARN Feld Rolle leer. Geben Sie in diesem Fall das ein, das ARN Sie verwenden möchten.

Feldrolle ARN. In diesem Feld wird standardmäßig jede Rolle mit dem Präfix SagemakerJupyterScheduler angezeigt. Wenn Sie mehrere Rollen mit dem Präfix haben, wählt die Erweiterung eine aus. Ändern Sie dieses Feld bei Bedarf in einen benutzerdefinierten Wert. Für dieses Feld können Sie Ihren eigenen Benutzerstandard festlegen, der bei jeder Erstellung einer neuen Auftragsdefinition automatisch ausgefüllt wird. Details hierzu finden Sie unter Richten Sie Standardoptionen für lokale Notebooks ein. Parameterrole. Standardmäßig wird die SageMaker IAM Standardrolle verwendet, wenn der in SageMaker Notebooks oder SageMaker Studio Notebooks ausgeführt SDK wird. Andernfalls wird ein ausgelöst. ValueError Erlaubt intelligente Standardeinstellungen.
Eingabe-Notizbuch Der Name des Notebooks, dessen Ausführung Sie planen. Pflichtfeld Feld-Eingabedatei. Wie Studio. Erforderlich. Parameterinput_notebook.
Eingabeordner Der Ordner, der Ihre Eingaben enthält. Die Auftragseingaben, einschließlich des Eingabe-Notebooks und aller optionalen Start- oder Initialisierungsskripten, werden in diesem Ordner gespeichert. Ordner für die Feldeingabe. Wenn Sie keinen Ordner angeben, erstellt der Scheduler einen standardmäßigen Amazon-S3-Bucket für Ihre Eingaben. Wie Studio. Für dieses Feld können Sie Ihren eigenen Benutzerstandard festlegen, der bei jeder Erstellung einer neuen Auftragsdefinition automatisch ausgefüllt wird. Details hierzu finden Sie unter Richten Sie Standardoptionen für lokale Notebooks ein. N/A. Der Eingabeordner befindet sich an dem durch den Parameter s3_root_uri angegebenen Speicherort.
Ausgangsordner Der Ordner, der Ihre Ausgaben enthält. Die Auftragsausgaben, einschließlich des Ausgabe-Notebooks und der Protokolle, werden in diesem Ordner gespeichert. Feldausgabeordner. Wenn Sie keinen Ordner angeben, erstellt der Scheduler einen standardmäßigen Amazon-S3-Bucket für Ihre Ausgaben. Wie Studio. Für dieses Feld können Sie Ihren eigenen Benutzerstandard festlegen, der bei jeder Erstellung einer neuen Auftragsdefinition automatisch ausgefüllt wird. Details hierzu finden Sie unter Richten Sie Standardoptionen für lokale Notebooks ein. N/A. Der Ausgabeordner befindet sich an dem durch den Parameter s3_root_uri angegebenen Speicherort.
Parameter Ein Wörterbuch mit Variablen und Werten, das Sie an Ihren Notebook-Job übergeben können. Feldparameter. Sie müssen Ihr Notebook parametrisieren, um Parameter zu akzeptieren. Wie Studio. Parameter. parameters Sie müssen Ihr Notebook parametrisieren, um Parameter zu akzeptieren.
Zusätzliche Abhängigkeiten (Datei oder Ordner) Die Liste der Datei- oder Ordnerabhängigkeiten, die der Notebook-Job in den Staging-Ordner S3 hochlädt. Nicht unterstützt Nicht unterstützt Parameter. additional_dependencies Der Notebook-Job lädt diese Abhängigkeiten in einen S3-Staging-Ordner hoch, sodass sie während der Ausführung verwendet werden können.
S3-Root URI Der Ordner, der Ihre Eingaben enthält. Die Auftragseingaben, einschließlich des Eingabe-Notebooks und aller optionalen Start- oder Initialisierungsskripten, werden in diesem Ordner gespeichert. N/A. Verwenden Sie den Eingabeordner und den Ausgabeordner. Wie Studio. Parameters3_root_uri. Standardmäßig wird ein Standard-S3-Bucket verwendet. Erlaubt intelligente Standardeinstellungen.
Umgebungsvariablen Alle vorhandenen Umgebungsvariablen, die Sie überschreiben möchten, oder neue Umgebungsvariablen, die Sie in Ihrem Notebook einführen und verwenden möchten. Feldumgebungsvariablen. Wie Studio. Parameterenvironment_variables. Standardeinstellung: None.
Tags Eine Liste von Tags, die an den Job angehängt sind. N/A N/A Parametertags. Standardeinstellung: None. Ihre Tags steuern, wie die Studio-Benutzeroberfläche den von der Pipeline erstellten Job erfasst und anzeigt. Details hierzu finden Sie unter Sehen Sie sich Ihre Notebook-Jobs im Studio-UI-Dashboard an.
Startskript Ein im Startmenü des Notebooks vorinstalliertes Skript, das Sie vor der Ausführung des Notebooks ausführen können. Feldstartskript. Wählen Sie ein Lifecycle-Konfigurationsskript (LCC) aus, das beim Start auf dem Image ausgeführt wird.
Anmerkung

Ein Startskript wird in einer Shell außerhalb der Studio-Umgebung ausgeführt. Daher kann dieses Skript nicht vom lokalen Studio-Speicher, den Umgebungsvariablen oder den App-Metadaten (in /opt/ml/metadata) abhängen. Wenn Sie ein Startskript und ein Initialisierungsskript verwenden, wird das Startskript außerdem zuerst ausgeführt.

Nicht unterstützt Nicht unterstützt
Das Initialisierungsskript Ein Pfad zu einem lokalen Skript, das Sie ausführen können, wenn Ihr Notebook gestartet wird. Feldinitialisierungsskript. Geben Sie den EFS Dateipfad ein, in dem sich ein lokales Skript oder ein Lifecycle Configuration (LCC) -Skript befindet. Wenn Sie ein Startskript und ein Initialisierungsskript verwenden, wird das Startskript zuerst ausgeführt.
Anmerkung

Ein Initialisierungsskript stammt aus derselben Shell wie der Notebook-Auftrag. Dies ist bei einem zuvor beschriebenen Startskript nicht der Fall. Wenn Sie ein Startskript und ein Initialisierungsskript verwenden, wird das Startskript außerdem zuerst ausgeführt.

Feldinitialisierungsskript. Geben Sie den lokalen Dateipfad ein, in dem sich ein lokales Skript oder ein Lifecycle Configuration (LCC) -Skript befindet. Parameterinitialization_script. Standardeinstellung: None.
Max. Anzahl der Wiederholungsversuche Gibt an, wie oft Studio versucht, eine fehlgeschlagene Auftragsausführung erneut auszuführen. Feld Max. Wiederholungsversuche. Standardeinstellung: 1. Wie Studio. Parametermax_retry_attempts. Standardeinstellung: 1.
Max. Laufzeit (in Sekunden) Die maximale Zeitspanne in Sekunden, die der Notebook-Auftrag ausgeführt werden kann, bevor er gestoppt wird. Wenn Sie sowohl Max. Laufzeit als auch Max. Wiederholungsversuche konfigurieren, gilt die Laufzeit für jeden Wiederholungsversuch. Wenn ein Auftrag in dieser Zeit nicht abgeschlossen wird, wird sein Status auf Failed gesetzt. Feld Max. Laufzeit (in Sekunden). Standardeinstellung: 172800 seconds (2 days). Wie Studio. Parametermax_runtime_in_seconds. Standardeinstellung: 172800 seconds (2 days).
Richtlinien erneut versuchen Eine Liste von Richtlinien für Wiederholungsversuche, die die im Falle eines Fehlers zu ergreifenden Maßnahmen regeln. Nicht unterstützt Nicht unterstützt Parameterretry_policies. Standardeinstellung: None.
Fügen Sie Step StepCollection Abhängigkeiten hinzu Eine Liste von StepCollection Namen Step oder Instanzen, von denen der Job abhängt. Nicht unterstützt Nicht unterstützt Parameterdepends_on. Standardeinstellung: None. Verwenden Sie dies, um explizite Abhängigkeiten zwischen Schritten in Ihrem Pipeline-Diagramm zu definieren.
Volume-Größe Die Größe des Speichervolumens in GB zum Speichern von Eingabe- und Ausgabedaten während des Trainings. Nicht unterstützt Nicht unterstützt Parametervolume_size. Die Standardeinstellung ist 30 GB.
Verschlüsseln Sie den Verkehr zwischen Containern Ein Flag, das angibt, ob der Verkehr zwischen Trainingscontainern für den Trainingsjob verschlüsselt ist. N/A. Standardmäßig aktiviert. N/A. Standardmäßig aktiviert. Parameterencrypt_inter_container_traffic. Standardeinstellung: True.
Konfigurieren Sie die Auftragsverschlüsselung Ein Indikator dafür, dass Sie die Auftragsausgaben Ihres Notebooks, das Volumen Ihrer Auftrags-Instance oder beides verschlüsseln möchten. Feld Jobverschlüsselung konfigurieren. Markieren Sie dieses Kästchen, um Verschlüsselung auszuwählen. Wenn diese Option nicht aktiviert ist, werden die Jobausgaben mit dem KMS Standardschlüssel des Kontos verschlüsselt, und das Job-Instance-Volume ist nicht verschlüsselt. Wie Studio. Nicht unterstützt
KMSVerschlüsselungsschlüssel für die Ausgabe Ein KMS Schlüssel, den Sie verwenden können, wenn Sie den Verschlüsselungsschlüssel anpassen möchten, der für Ihre Notebook-Jobausgaben verwendet wird. Dieses Feld ist nur relevant, wenn Sie die Option Auftragsverschlüsselung konfigurieren aktiviert haben. Feld KMSVerschlüsselungsschlüssel ausgeben. Wenn Sie dieses Feld nicht angeben, werden Ihre Notebook-Jobausgaben mit SSE — KMS unter Verwendung des Amazon S3 KMS S3-Standardschlüssels verschlüsselt. Auch wenn Sie den Amazon-S3-Bucket selbst erstellen und Verschlüsselung verwenden, bleibt Ihre Verschlüsselungsmethode erhalten. Wie Studio. Für dieses Feld können Sie Ihren eigenen Benutzerstandard festlegen, der bei jeder Erstellung einer neuen Auftragsdefinition automatisch ausgefüllt wird. Details hierzu finden Sie unter Richten Sie Standardoptionen für lokale Notebooks ein. Parameters3_kms_key. Standardeinstellung: None. Ermöglicht intelligente Standardeinstellungen.
KMSVerschlüsselungsschlüssel für das Volume der Jobinstanz Ein KMS Schlüssel, den Sie verwenden können, wenn Sie Ihr Job-Instance-Volume verschlüsseln möchten. Dieses Feld ist nur relevant, wenn Sie die Option Auftragsverschlüsselung konfigurieren aktiviert haben. KMSVerschlüsselungsschlüssel für das Volume der Field Job-Instance. KMSVerschlüsselungsschlüssel für das Volume der Field Job-Instance. Für dieses Feld können Sie Ihren eigenen Benutzerstandard festlegen, der bei jeder Erstellung einer neuen Auftragsdefinition automatisch ausgefüllt wird. Details hierzu finden Sie unter Richten Sie Standardoptionen für lokale Notebooks ein. Parametervolume_kms_key. Standardeinstellung: None. Ermöglicht intelligente Standardeinstellungen.
Verwenden Sie eine Virtual Private Cloud, um diesen Job auszuführen (für VPC Benutzer) Ein Indikator dafür, dass Sie diesen Job in einer Virtual Private Cloud ausführen möchten (VPC). Aus Sicherheitsgründen wird empfohlen, eine private zu verwendenVPC. Feld Verwenden Sie eine virtuelle private Cloud, um diesen Job auszuführen. Markieren Sie dieses Kästchen, wenn Sie eine verwenden möchtenVPC. Erstellen Sie mindestens die folgenden VPC Endpunkte, damit Ihr Notebook-Job eine private Verbindung zu diesen AWS Ressourcen herstellen kann:
Wenn Sie sich für die Verwendung von entscheidenVPC, müssen Sie in den folgenden Optionen mindestens ein privates Subnetz und mindestens eine Sicherheitsgruppe angeben. Wenn Sie keine privaten Subnetze verwenden, müssen Sie andere Konfigurationsoptionen in Betracht ziehen. Einzelheiten finden Sie unter Öffentliche VPC Subnetze werden nicht unterstützt in. Einschränkungen und Überlegungen
Wie Studio. N/A
Subnetz (e) (für VPC Benutzer) Ihre Subnetze. Dieses Feld muss mindestens eines und höchstens fünf enthalten, und alle von Ihnen angegebenen Subnetze sollten privat sein. Einzelheiten finden Sie unter Öffentliche VPC Subnetze, die nicht unterstützt werden in. Einschränkungen und Überlegungen Feld Subnetz (e). Dieses Feld enthält standardmäßig die Subnetze, die der Studio-Domain zugeordnet sind. Sie können dieses Feld jedoch bei Bedarf ändern. Feld Subnetz (e). Der Scheduler kann Ihre Subnetze nicht erkennen, daher müssen Sie alle Subnetze eingeben, die Sie für Ihre konfiguriert haben. VPC Parameter. subnets Standardeinstellung: None. Ermöglicht intelligente Standardeinstellungen.
Sicherheitsgruppe (n) (für VPC Benutzer) Ihre Sicherheitsgruppen. Dieses Feld muss mindestens eine und maximal 15 enthalten. Einzelheiten finden Sie unter Öffentliche VPC Subnetze, die nicht unterstützt werden inEinschränkungen und Überlegungen. Feld Sicherheitsgruppen. Dieses Feld enthält standardmäßig die SicherheitsgruppenVPC, die der Domäne zugeordnet sind. Sie können dieses Feld jedoch bei Bedarf ändern. Feld Sicherheitsgruppen. Der Scheduler kann Ihre Sicherheitsgruppen nicht erkennen, daher müssen Sie alle Sicherheitsgruppen eingeben, die Sie für Ihre VPC konfiguriert haben. Parametersecurity_group_ids. Standardeinstellung: None. Ermöglicht intelligente Standardeinstellungen.
Name Der Name des Notebook-Auftragsschritts. N/A N/A Parametername. Falls nicht angegeben, wird er vom Namen der Notebookdatei abgeleitet.
Anzeigename Ihr Jobname, so wie er in Ihrer Liste der Pipeline-Ausführungen erscheinen sollte. N/A N/A Parameterdisplay_name. Standardeinstellung: None.
Beschreibung Eine Beschreibung Ihres Jobs. N/A N/A Parameterdescription.