Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
SageMaker HyperPod Verweise
Weitere Informationen und Referenzen zur Verwendung finden Sie SageMaker HyperPod in den folgenden Themen.
Themen
SageMaker HyperPod Preisgestaltung
Die folgenden Themen enthalten Informationen zur SageMaker HyperPod Preisgestaltung. Weitere Informationen zum Preis pro Stunde für die Nutzung von SageMaker HyperPod Instances finden Sie auch unter Amazon SageMaker AI-Preise
Kapazitätsanfragen
Sie können Rechenkapazität auf Abruf oder reservierte Rechenkapazität mit SageMaker KI zur Verwendung auf SageMaker HyperPod zuweisen. Bei der On-Demand-Clustererstellung werden verfügbare Kapazitäten aus dem SageMaker KI-On-Demand-Kapazitätspool zugewiesen. Alternativ können Sie reservierte Kapazität anfordern, um den Zugriff sicherzustellen, indem Sie ein Ticket für eine Erhöhung des Kontingents einreichen. Eingehende Kapazitätsanfragen werden von SageMaker KI priorisiert und Sie erhalten eine geschätzte Zeit für die Kapazitätszuweisung.
Abrechnung der Dienste
Wenn Sie Rechenkapazität am bereitstellen SageMaker HyperPod, wird Ihnen die Dauer der Kapazitätszuweisung in Rechnung gestellt. SageMaker HyperPod Die Abrechnung erscheint in Ihren Jubiläumsrechnungen mit einer Zeile für die Art der Kapazitätszuweisung (auf Abruf, reserviert), den Instance-Typ und die für die Nutzung der Instance aufgewendete Zeit.
Informationen zum Einreichen eines Tickets für eine Erhöhung des Kontingents finden Sie unterSageMaker HyperPod Kontingente.
SageMaker HyperPod APIs
In der folgenden Liste finden Sie eine vollständige Liste SageMaker HyperPod APIs für die Einreichung von Aktionsanfragen im JSON Format an SageMaker KI über AWS CLI oder AWS SDK for Python (Boto3).
SageMaker HyperPod Formulare
Um das Slurm-Workload-Manager-Tool zu konfigurieren HyperPod, sollten Sie HyperPod mithilfe des bereitgestellten Formulars eine erforderliche Slurm-Konfigurationsdatei erstellen.
Konfigurationsformular für die Bereitstellung von Slurm-Knoten auf HyperPod
Der folgende Code ist das Slurm-Konfigurationsformular, das Sie vorbereiten sollten, um Slurm-Knoten auf Ihrem Cluster ordnungsgemäß einzurichten. HyperPod Sie sollten dieses Formular ausfüllen und es während der Clustererstellung als Teil einer Reihe von Lebenszyklus-Skripten hochladen. Informationen darüber, wie dieses Formular während der HyperPod Clustererstellung vorbereitet werden sollte, finden Sie unterPassen Sie SageMaker HyperPod Cluster mithilfe von Lebenszyklusskripten an.
// Save as provisioning_params.json. { "version": "1.0.0", "workload_manager": "slurm", "controller_group": "
string
", "login_group": "string
", "worker_groups": [ { "instance_group_name": "string
", "partition_name": "string
" } ], "fsx_dns_name": "string
", "fsx_mountname": "string
" }
-
version
– Erforderlich. Dies ist die Version des Formulars für HyperPod Bereitstellungsparameter. Behalte es bei.1.0.0
-
workload_manager
– Erforderlich. Hier können Sie angeben, welcher Workload-Manager auf dem HyperPod Cluster konfiguriert werden soll. Behalten Sie es beislurm
. -
controller_group
– Erforderlich. Hier geben Sie den Namen der HyperPod Cluster-Instanzgruppe an, die Sie dem Slurm-Controller-Knoten (Head) zuweisen möchten. -
login_group
Optional. Dies dient zur Angabe des Namens der HyperPod Cluster-Instanzgruppe, die Sie dem Slurm-Login-Knoten zuweisen möchten. -
worker_groups
– Erforderlich. Dies dient zum Einrichten von Slurm-Worker-Knoten (Compute) auf dem HyperPod Cluster.-
instance_group_name
– Erforderlich. Dies dient zur Angabe des Namens der HyperPod Instanzgruppe, die Sie dem Slurm-Worker-Knoten (Compute) zuweisen möchten. -
partition_name
– Erforderlich. Dies dient zur Angabe des Partitionsnamens für den Knoten.
-
-
fsx_dns_name
Optional. Wenn Sie Ihre Slurm-Knoten auf dem HyperPod Cluster für die Kommunikation mit Amazon einrichten möchtenFSx, geben Sie den FSx DNS Namen an. -
fsx_mountname
Optional. Wenn Sie Ihre Slurm-Knoten auf dem HyperPod Cluster für die Kommunikation mit Amazon einrichten möchtenFSx, geben Sie den FSx Mount-Namen an.
SageMaker HyperPod DLAMI
SageMaker HyperPod läuft DLAMI auf der Grundlage von:
-
AWS Deep Learning Base GPU AMI (Ubuntu 20.04)
für die Orchestrierung mit Slurm. -
Amazon Linux 2-basiert AMI für die Orchestrierung mit AmazonEKS.
Das SageMaker HyperPod DLAMI ist mit zusätzlichen Paketen zur Unterstützung von Open-Source-Tools wie Slurm, Kubernetes, Abhängigkeiten und SageMaker HyperPod Cluster-Softwarepaketen gebündelt, um Resilienzfunktionen wie Cluster-Integritätsprüfung und automatische Wiederaufnahme zu unterstützen. Weitere Informationen zu HyperPod Softwareupdates, über die das HyperPod Serviceteam verteilt, finden Sie unter. DLAMIs SageMaker HyperPod Versionshinweise von Amazon
Referenz für SageMaker HyperPod API-Berechtigungen
Wichtig
Benutzerdefinierte IAM Richtlinien, die es Amazon SageMaker Studio oder Amazon SageMaker Studio Classic ermöglichen, SageMaker Amazon-Ressourcen zu erstellen, müssen auch Berechtigungen zum Hinzufügen von Tags zu diesen Ressourcen gewähren. Die Genehmigung zum Hinzufügen von Tags zu Ressourcen ist erforderlich, da Studio und Studio Classic automatisch alle von ihnen erstellten Ressourcen taggen. Wenn eine IAM Richtlinie Studio und Studio Classic das Erstellen von Ressourcen, aber kein Taggen erlaubt, können "AccessDenied" Fehler auftreten, wenn versucht wird, Ressourcen zu erstellen. Weitere Informationen finden Sie unter Stellen Sie Berechtigungen für das Taggen von KI-Ressourcen SageMaker bereit.
AWS verwaltete Richtlinien für Amazon SageMaker AIdie Berechtigungen zum Erstellen von SageMaker Ressourcen gewähren, beinhalten bereits Berechtigungen zum Hinzufügen von Tags beim Erstellen dieser Ressourcen.
Wenn Sie die Zugriffskontrolle einrichten, um die Ausführung von SageMaker HyperPod API Vorgängen zu ermöglichen, und eine Berechtigungsrichtlinie schreiben, die Sie IAM Benutzern für Cloud-Administratoren zuordnen können, verwenden Sie die folgende Tabelle als Referenz.
SageMaker APIAmazon-Betrieb | Erforderliche Berechtigungen (APIAktionen) | Ressourcen |
CreateCluster | sagemaker:CreateCluster |
arn:aws:sagemaker: |
DeleteCluster | sagemaker:DeleteCluster |
arn:aws:sagemaker: |
DescribeCluster | sagemaker:DescribeCluster |
arn:aws:sagemaker: |
DescribeClusterNode | sagemaker:DescribeClusterNode |
arn:aws:sagemaker: |
ListClusterNodes | sagemaker:ListClusterNodes |
arn:aws:sagemaker: |
ListClusters | sagemaker:ListClusters |
arn:aws:sagemaker: |
UpdateCluster | sagemaker:UpdateCluster |
arn:aws:sagemaker: |
UpdateClusterSoftware | sagemaker:UpdateClusterSoftware |
arn:aws:sagemaker: |
Eine vollständige Liste der Berechtigungen und Ressourcentypen für SageMaker APIs finden Sie unter Aktionen, Ressourcen und Bedingungsschlüssel für Amazon SageMaker AI in der AWS Service Authorization Reference.
SageMaker HyperPod Befehle in AWS CLI
Im Folgenden finden Sie die AWS CLI Befehle SageMaker HyperPod zum Ausführen der HyperPod APIKernoperationen.
SageMaker HyperPod Python-Module in AWS SDK for Python (Boto3)
Im Folgenden sind die Methoden des AWS SDK for Python (Boto3) Clients aufgeführt, mit denen SageMaker KI die HyperPod APIKernoperationen ausführt.