Voraussetzungen für die Verwendung von SageMaker HyperPod - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Voraussetzungen für die Verwendung von SageMaker HyperPod

In den folgenden Abschnitten werden die Voraussetzungen beschrieben, bevor Sie damit beginnen SageMaker HyperPod.

SageMaker HyperPod Kontingente

Sie können SageMaker HyperPod Cluster erstellen, wenn Sie die Kontingente für die Clusternutzung in Ihrem AWS Konto berücksichtigen.

Wichtig

Weitere Informationen zur SageMaker HyperPod Preisgestaltung finden Sie unter SageMaker HyperPod Preisgestaltung und unter SageMaker Amazon-Preise.

SageMaker HyperPodAmazon-Kontingente über die AWS Management-Konsole anzeigen

Suchen Sie nach den Standardwerten und den angewendeten Werten eines Kontingents, das auch als Limit bezeichnet wird, für die Cluster-Nutzung SageMaker HyperPod.

  1. Öffnen Sie die Service Quotas -Konsole.

  2. Wählen Sie im linken Navigationsbereich AWS services aus.

  3. Suchen Sie in der AWS Serviceliste nach Amazon und wählen Sie es aus SageMaker.

  4. In der Liste der Servicekontingente finden Sie den Namen des Servicekontingents, den angewendeten Wert (falls verfügbar), das AWS Standardkontingent und ob das Kontingent anpassbar ist.

  5. Geben Sie in der Suchleiste Cluster-Nutzung ein. Hier werden die Kontingente für die Cluster-Nutzung, die angewendeten Kontingente und die Standardkontingente angezeigt.

SageMaker HyperPod Amazon-Kontingente über die AWS Management Console anfordern

Erhöhen Sie Ihre Kontingente auf Konto- oder Ressourcenebene.

  1. Um das Kontingent der Instances für die Cluster-Nutzung zu erhöhen, wählen Sie das Kontingent aus, das Sie erhöhen möchten.

  2. Wenn das Kontingent anpassbar ist, können Sie eine Erhöhung des Kontingents entweder auf Konto- oder Ressourcenebene beantragen, basierend auf dem Wert, der in der Spalte Einstellbarkeit aufgeführt ist.

  3. Geben Sie unter Kontingentwert erhöhen den neuen Wert ein. Der neue Wert muss größer als der aktuelle Wert sein.

  4. Wählen Sie Request (Anfrage).

  5. Um ausstehende oder kürzlich gelöste Anfragen in der Konsole anzuzeigen, navigieren Sie auf der Detailseite des Dienstes zur Registerkarte Anforderungsverlauf oder wählen Sie im Navigationsbereich Dashboard aus. Wählen Sie für ausstehende Anfragen den Status der Anfrage, um die Anfrage zu öffnen. Der Anfangsstatus einer Anfrage ist Pending (Ausstehend). Nachdem sich der Status in „Kontingent angefordert“ geändert hat, wird die Fallnummer mit angezeigt AWS Support. Wählen Sie die Fallnummer, um das Ticket für Ihre Anfrage zu öffnen.

Weitere Informationen zur Beantragung einer Kontingenterhöhung im Allgemeinen finden Sie unter Beantragung einer Kontingenterhöhung im AWS Servicekontingents-Benutzerhandbuch.

Einrichtung SageMaker HyperPod bei Amazon VPC

Um einen SageMaker HyperPod Cluster mit Ihrem Amazon einzurichtenVPC, überprüfen Sie die folgenden Punkte.

Anmerkung

Es ist für die Orchestrierung mit erforderlichEKS, und Sie müssen dasselbe VPC für den HyperPod Cluster verwenden. Für die Orchestrierung mit Slurm ist die Einrichtung einer eigenen Orchestrierung optional. VPC

  • Wenn Sie Ihre eigenen verwenden möchten, VPC um sich SageMaker HyperPod mit AWS Ressourcen in Ihrem System zu verbindenVPC, müssen Sie bei der Erstellung den VPC Namen, die ID AWS-Region, die Subnetz-ID und die Sicherheitsgruppen-ID angeben. SageMaker HyperPod Wenn Sie ein neues erstellen möchtenVPC, finden Sie weitere Informationen unter Standard erstellen VPC oder Erstellen eines VPC im Amazon Virtual Private Cloud Cloud-Benutzerhandbuch.

  • Es ist wichtig, dass Sie alle Ihre Ressourcen in derselben Availability Zone erstellen AWS-Region und Sicherheitsgruppenregeln konfigurieren, um eine Verbindung zwischen den Ressourcen in Ihrer zu ermöglichenVPC. Gehen Sie beispielsweise davon aus, dass Sie einen VPC in erstellenus-west-2. Sie sollten VPC in dieser Availability Zone ein Subnetz und eine Sicherheitsgruppe erstellenus-west-2a, die den gesamten eingehenden (eingehenden) Verkehr innerhalb der Sicherheitsgruppe sowie den gesamten ausgehenden Verkehr zulässt.

  • Sie müssen auch sicherstellen, dass Sie VPC eine Verbindung zu Amazon Simple Storage Service (Amazon S3) haben. Wenn Sie a konfigurierenVPC, haben SageMaker HyperPod Instance-Gruppen keinen Zugriff auf das Internet und können daher keine Verbindung zu Amazon S3 herstellen, um auf Dateien wie Lebenszyklus-Skripts, Trainingsdaten und Modellartefakte zuzugreifen oder diese zu speichern. Um während der Verwendung eine Verbindung mit Amazon S3 herzustellenVPC, sollten Sie einen VPC Endpunkt erstellen. Indem Sie einen VPC Endpunkt erstellen, können Sie den SageMaker HyperPod Instanzgruppen den Zugriff auf die Amazon S3 S3-Buckets innerhalb desselben VPC ermöglichen. Wir empfehlen Ihnen, auch eine benutzerdefinierte Richtlinie zu erstellen, die nur Anfragen von Ihren privaten Benutzern den VPC Zugriff auf Ihre Amazon S3 S3-Buckets zulässt. Weitere Informationen finden Sie im AWS PrivateLink Handbuch unter Endpoints for Amazon S3.

  • Wenn Sie einen HyperPod Cluster mit EFA -aktivierten Instances erstellen möchten, stellen Sie sicher, dass Sie eine Sicherheitsgruppe einrichten, die den gesamten eingehenden und ausgehenden Datenverkehr zur und von der Sicherheitsgruppe selbst zulässt. Weitere Informationen finden Sie unter Schritt 1: Vorbereiten einer EFA -aktivierten Sicherheitsgruppe im EC2Amazon-Benutzerhandbuch.

Einrichtung AWS Systems Manager und „Run As“ für die Cluster-Benutzerzugriffskontrolle

SageMaker HyperPod DLAMIist standardmäßig mit AWS Systems Manager(SSM) ausgestattet, um Ihnen bei der Verwaltung des Zugriffs auf Ihre SageMaker HyperPod Cluster-Instanzgruppen zu helfen. In diesem Abschnitt wird beschrieben, wie Sie Betriebssystembenutzer (OS) in Ihren SageMaker HyperPod Clustern erstellen und sie IAM Benutzern und Rollen zuordnen. Dies ist nützlich, um SSM Sitzungen mit den Anmeldeinformationen des Betriebssystem-Benutzerkontos zu authentifizieren.

Aktivieren Sie „Ausführen als“ in Ihrem Konto AWS

Als AWS Kontoadministrator oder Cloud-Administrator können Sie den Zugriff auf SageMaker HyperPod Cluster auf IAM Rollen- oder Benutzerebene verwalten, indem Sie die Funktion „Ausführen als“ in verwendenSSM. Mit dieser Funktion können Sie jede SSM Sitzung mit dem Betriebssystembenutzer starten, der der IAM Rolle oder dem Benutzer zugeordnet ist.

Um Run As in Ihrem AWS Konto zu aktivieren, folgen Sie den Schritten unter Run As-Unterstützung für verwaltete Linux- und macOS-Nodes aktivieren. Wenn Sie bereits Betriebssystembenutzer in Ihrem Cluster erstellt haben, stellen Sie sicher, dass Sie sie IAM Rollen oder Benutzern zuordnen, indem Sie sie wie in Option 2 von Schritt 5 unter So aktivieren Sie die Unterstützung „Als ausführen“ für verwaltete Linux- und macOS-Nodes beschrieben taggen.

(Optional) Einrichtung SageMaker HyperPod mit Amazon FSx for Lustre

Um mit der Verwendung SageMaker HyperPod und Zuordnung von Datenpfaden zwischen dem Cluster und Ihrem FSx for Lustre-Dateisystem zu beginnen, wählen Sie einen der AWS-Regionen unterstützten von. SageMaker HyperPod Nachdem AWS-Region Sie die von Ihnen bevorzugte ausgewählt haben, sollten Sie auch festlegen, welche Availability Zone (AZ) Sie verwenden möchten. Wenn Sie SageMaker HyperPod Rechenknoten an einem AZs anderen Ort als AZs dem verwenden, an dem Ihr FSx for Lustre-Dateisystem eingerichtet ist AWS-Region, kann es zu Kommunikations- und Netzwerkaufwand kommen. Wir empfehlen Ihnen, dieselbe physische AZ wie die für das SageMaker HyperPod Dienstkonto zu verwenden, um AZ-übergreifenden Verkehr zwischen SageMaker HyperPod Clustern und Ihrem FSx for Lustre-Dateisystem zu vermeiden. Stellen Sie außerdem sicher, dass Sie es mit Ihrem konfiguriert haben. VPC Wenn Sie Amazon FSx als Hauptdateisystem für die Speicherung verwenden möchten, müssen Sie SageMaker HyperPod Cluster mit konfigurierenVPC.