Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Erstellen eines Clusters mit einem externen Slurmdbd Buchhaltung
Erfahren Sie, wie Sie einen Cluster mit externen Komponenten konfigurieren und erstellen Slurmdbd Buchhaltung. Weitere Informationen finden Sie unter Slurm Buchhaltung mit AWS ParallelCluster.
Wenn Sie die AWS ParallelCluster Befehlszeilenschnittstelle (CLI) oder API verwenden, zahlen Sie nur für die AWS Ressourcen, die beim Erstellen oder Aktualisieren von AWS ParallelCluster Images und Clustern erstellt werden. Weitere Informationen finden Sie unter AWS Dienste, die von verwendet werden AWS ParallelCluster.
Die AWS ParallelCluster Benutzeroberfläche basiert auf einer serverlosen Architektur und Sie können sie innerhalb der AWS Free Tier Kategorie für die meisten Fälle. Weitere Informationen finden Sie unter AWS ParallelCluster UI-Kosten.
In diesem Tutorial verwenden Sie eine AWS CloudFormation Schnellerstellungsvorlage, um die erforderlichen Komponenten für die Bereitstellung einer Slurmdbd-Instanz auf derselben VPC wie der Cluster zu erstellen. Die Vorlage erstellt eine grundlegende Netzwerk- und Sicherheitskonfiguration für die Verbindung zwischen dem Cluster und der Datenbank.
Anmerkung
Beginnend mitversion 3.10.0
, AWS ParallelCluster unterstützt externes Slurmdbd mit dem Cluster-Konfigurationsparameter. SlurmSettings / ExternelSlurmdbd
Anmerkung
Die Vorlage für die Schnellerstellung dient als Beispiel. Diese Vorlage deckt nicht alle möglichen Anwendungsfälle ab. Es liegt in Ihrer Verantwortung, eine externe Slurmdbd mit der Konfiguration und Kapazität zu erstellen, die für Ihre Produktionsworkloads geeignet sind.
Voraussetzungen:
-
AWS ParallelCluster ist installiert.
-
Das AWS CLI ist installiert und konfiguriert.
-
Sie haben ein Amazon Elastic Compute Cloud-Schlüsselpaar.
-
Sie haben eine AWS Identity and Access Management Rolle mit den Berechtigungen, die für die Ausführung der pcluster CLI erforderlich sind.
-
Sie haben eine Slurm Buchhaltungsdatenbank. Um ein Tutorial zum Erstellen Schritt für Schritt durchzugehen Slurm Folgen Sie den Schritten 1 und 2 unter Erstellen Sie den Slurm-Buchhaltungsdatenbank-Stack.
Schritt 1: Erstellen Sie den Slurmdbd-Stack
Verwenden Sie in diesem Tutorial eine CloudFormation Schnellerstellungsvorlage (us-east-1
), um einen Slurmdbd-Stack zu erstellen
Netzwerk
-
VPCId: Die VPC-ID zum Starten der Slurmdbd-Instanz.
-
SubnetId: Die Subnetz-ID zum Starten der Slurmdbd-Instanz.
-
PrivatePrefix: Das CIDR-Präfix der VPC.
-
PrivateIp: Eine sekundäre private IP, die der Slurmdbd-Instanz zugewiesen werden soll.
Datenbankverbindungen
-
DBMSClientSG: Die Sicherheitsgruppe, die an die Slurmdbd-Instanz angehängt werden soll. Diese Sicherheitsgruppe sollte Verbindungen zwischen dem Datenbankserver und der Slurmdbd-Instanz ermöglichen.
-
DBMSDatabaseName: Der Name der Datenbank.
-
DBMSUsername: Der Benutzername der Datenbank.
-
DBMSPasswordSecretArn: Das Geheimnis, das das Passwort für die Datenbank enthält.
-
DBMSUri: Die URI des Datenbankservers.
Instance-Einstellungen
-
InstanceType: Ein Instanztyp, der für die slurmdbd-Instanz verwendet werden soll.
-
KeyName: Ein EC2 Amazon-Schlüsselpaar, das für die Slurmdbd-Instance verwendet werden soll.
Slurmdbd-Einstellungen
-
AMIID: Ein AMI der Slurmdbd-Instanz. Das AMI sollte ein ParallelCluster AMI sein. Die Version des ParallelCluster AMI bestimmt die Version von Slurmdbd.
-
MungeKeySecretArn: Das Geheimnis, das den Munge-Schlüssel enthält, der für die Authentifizierung der Kommunikation zwischen Slurmdbd und Clustern verwendet wird.
-
SlurmdbdPort: Eine Portnummer, die die Slurmdbd verwendet.
-
EnableSlurmdbdSystemService: Aktiviert slurmdbd als Systemdienst und lässt ihn ausführen, wenn eine Instanz gestartet wird.
Warnung
Wenn die Datenbank mit einer anderen Version von erstellt wurde SlurmDB, verwende nicht Slurmdbd als Systemdienst.
Wenn die Datenbank eine große Anzahl von Einträgen enthält, Slurm Database Daemon (SlurmDBD) Die Aktualisierung der Datenbank kann mehrere zehn Minuten in Anspruch nehmen und reagiert während dieses Zeitintervalls nicht.
Vor dem Upgrade SlurmDB, erstellen Sie eine Sicherungskopie der Datenbank. Weitere Informationen finden Sie hier: Slurm Dokumentation
Schritt 2: Erstellen Sie einen Cluster mit externen Slurmdbd aktiviert
Die bereitgestellte AWS CloudFormation Vorlage generiert einen AWS CloudFormation Stapel mit einigen definierten Ausgaben.
Rufen Sie von der aus die Registerkarte Ausgaben im AWS CloudFormation Stapel auf AWS Management Console, um die erstellten Entitäten zu überprüfen. Um das zu aktivieren Slurm Bei der Buchhaltung müssen einige dieser Ausgaben in der AWS ParallelCluster Konfigurationsdatei verwendet werden:
-
SlurmdbdPrivateIp: Wird für den Konfigurationsparameter SlurmSettings/ExternalSlurmdbd/Host-Cluster verwendet.
-
SlurmdbdPort: Wird für den Wert des ExternalSlurmdbdCluster-Konfigurationsparameters SlurmSettings//Port verwendet.
-
AccountingClientSecurityGroup: Dies ist die Sicherheitsgruppe, die an den Hauptknoten des Clusters angehängt ist, der im Konfigurationsparameter/Networking HeadNode/definiert ist. AdditionalSecurityGroups
Zusätzlich können Sie auf der Registerkarte „Parameter“ in der Stack-Ansicht Folgendes tun: AWS CloudFormation
-
MungeKeySecretArn: Wird für den MungeKeySecretArnCluster-Konfigurationsparameterwert SlurmSettings/verwendet.
Aktualisieren Sie die Datenbankparameter Ihrer Cluster-Konfigurationsdatei mit den Ausgabewerten. Verwenden Sie den pcluster, um den Cluster AWS CLI zu erstellen.
$
pcluster create-cluster -ncluster-3.x
-cpath/to/cluster-config.yaml
Nachdem der Cluster erstellt wurde, können Sie mit der Verwendung beginnen Slurm Buchhaltungsbefehle wie sacctmgr
odersacct
.
Warnung
Verkehr zwischen ParallelCluster
und nach außen SlurmDB ist nicht verschlüsselt. Es wird empfohlen, den Cluster und den externen SlurmDB in einem vertrauenswürdigen Netzwerk.