Slurm-Versionen in AWS PCS - AWS PCS

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Slurm-Versionen in AWS PCS

SchedMD erweitert Slurm kontinuierlich mit neuen Funktionen, Optimierungen und Sicherheitspatches. SchedMD veröffentlicht in regelmäßigen Abständen eine neue Hauptversion und plant, bis zu 3 Versionen gleichzeitig zu unterstützen. AWS PCS unterstützt zunächst Slurm 23.11. AWS PCS ist so konzipiert, dass der Slurm-Controller automatisch mit Patch-Versionen aktualisiert wird.

Wenn SchedMD die Unterstützung für eine bestimmte Hauptversion beendet, beendet AWS PCS auch die Unterstützung für diese Hauptversion. AWS PCS sendet im Voraus eine Benachrichtigung, wenn eine Slurm-Hauptversion kurz vor dem Ende ihrer Lebensdauer steht, damit Kunden wissen, wann sie ihre Cluster auf eine neuere unterstützte Version aktualisieren müssen.

Wir empfehlen Ihnen, für die Bereitstellung Ihres Clusters die neueste unterstützte Slurm-Version zu verwenden, um auf die neuesten Weiterentwicklungen und Verbesserungen zugreifen zu können.

Häufig gestellte Fragen zu Slurm-Versionen

Wie lange unterstützt AWS PCS eine Slurm-Version?

AWS PCS folgt den SchedMD-Supportzyklen für Hauptversionen. AWS PCS unterstützt bis zu 3 Hauptversionen gleichzeitig. Nachdem SchedMD eine neue Hauptversion veröffentlicht hat, stellt AWS PCS die älteste unterstützte Version zurück. AWS PCS veröffentlicht so bald wie möglich eine neue Hauptversion von Slurm, aber es kann zu Verzögerungen zwischen der SchedMD-Veröffentlichung und ihrer Verfügbarkeit in PCS kommen. AWS

Wann informiert mich AWS PCS über das Ende der Support (EOSL) für Slurm-Versionen?

AWS PCS benachrichtigt Sie vor dem EOSL-Datum mehrmals in einem vorher festgelegten Rhythmus.

Was muss ich tun, wenn sich eine Slurm-Version EOSL nähert?

Sie müssen Ihre Slurm-Versionen vor EOSL aktualisieren, um eine sichere und unterstützte Umgebung aufrechtzuerhalten.

Wie kann ich meine Cluster aktualisieren, um eine neue Hauptversion von Slurm zu verwenden?

Um die Slurm-Version zu aktualisieren, müssen Sie einen neuen Cluster erstellen. Sie müssen auch ein Upgrade auf die entsprechende AWS PCS-Software in Ihrem Amazon Machine Image (AMI) durchführen und damit die Rechenknotengruppen für Ihren neuen Cluster erstellen.

Wie erhalten meine Cluster neue Slurm-Patch-Versionen?

AWS PCS ist so konzipiert, dass es automatisch Patches einspielt, um die häufigsten Sicherheitslücken und Exposures von Slurm zu beheben (). CVEs AWS PCS wendet die Patches auf Cluster-Controller an, die unter internen Dienstkonten ausgeführt werden. Um Patches auf Ihren EC2 Instances zu installieren AWS-Konto, aktualisieren Sie das AMI für Ihre Compute-Knotengruppen und aktualisieren Sie die Compute-Knotengruppen, sodass sie das aktualisierte AMI verwenden. Weitere Informationen finden Sie unter Benutzerdefinierte Amazon Machine Images (AMIs) für AWS PCS.

Anmerkung

Slurm-Controller sind nicht verfügbar, solange wir sie aktualisieren. Laufende Jobs sind nicht betroffen. Jobs, die gesendet werden, wenn der Controller des Clusters nicht verfügbar ist, werden zurückgehalten, bis der Controller verfügbar ist.

Was ist, wenn ich Slurm nicht bis zum EOSL-Datum aktualisiere?

AWS PCS wurde entwickelt, um Cluster zu stoppen, die eine nicht unterstützte Slurm-Version haben. Sie müssen die Slurm-Hauptversion des Cluster-Controllers und die auf den AWS Rechenknotengruppen installierte PCS-Software aktualisieren.

Wie viele Slurm-Versionen unterstützt AWS PCS?

AWS PCS unterstützt bis zu 3 große Slurm-Versionen gleichzeitig, einschließlich der aktuellen und der 2 vorherigen Hauptversionen.

Welche Slurm-Versionsupdates sollte ich anwenden?

Wir empfehlen Ihnen dringend, dieselbe Hauptversion für alle Komponenten in Ihrem Cluster zu verwenden und die neuesten Patches zu installieren, sobald sie veröffentlicht werden. Die Knotengruppen AMIs für Ihre Datenverarbeitung müssen eine Version der Slurm-Software verwenden, die mit der Slurm-Version des Cluster-Controllers kompatibel ist. Die Slurm-Hauptversion in Ihrer AMIs muss sich innerhalb von 2 Versionen der Slurm-Hauptversion auf dem Cluster-Controller befinden. Die im AMI und auf den laufenden EC2 Instances im Cluster installierte Slurm-Version darf nicht neuer sein als die Slurm-Version auf dem Cluster-Controller. Um die Unterstützung für Ihren Cluster aufrechtzuerhalten, AMIs müssen Sie eine unterstützte AWS PCS-Softwareversion verwenden.

Was ist, wenn ich die Slurm-Hauptversion aktualisiere, aber ältere Slurm-Software in meinem AMI für Compute-Knotengruppen verwende?

Sie müssen die AWS PCS-Software auf dieselbe Version aktualisieren, um die neue Slurm-Funktionalität nutzen zu können. Für eine vollständige AWS PCS-Unterstützung müssen alle Slurm-Komponenten unterstützte Versionen verwenden. Zusammenfassend:

  • Wir sind in der Lage, vollen Support zu bieten, wenn der Cluster-Controller und alle Komponenten (AWS PCS-Pakete) in Ihren AWS-Konto beiden Versionen die unterstützten Versionen verwenden.

  • AWS PCS ist so konzipiert, dass ein Cluster gestoppt wird, wenn die Slurm-Version seines Controllers EOSL erreicht.

  • Wenn die Slurm-Version der Komponenten in Ihrem System EOSL AWS-Konto erreicht, wird Ihr Cluster nicht unterstützt.

In welcher Reihenfolge sollte ich die Komponenten in meinem Cluster aktualisieren?

Sie müssen die Slurm-Version Ihres Cluster-Controllers aktualisieren, bevor Sie ein AMI mit einer neueren Slurm-Version verwenden. Sie aktualisieren eine Compute-Knotengruppe, um das AMI zu verwenden. AWS PCS verwendet das AMI, um neue EC2 Instances in der Compute-Knotengruppe zu starten. AWS PCS aktualisiert keine vorhandenen EC2 Instances mit laufenden Jobs. AWS PCS ist so konzipiert, dass diese Instances nach Abschluss ihrer Jobs beendet werden.

Bietet AWS PCS erweiterten Support für Slurm-Versionen?

Nein. Wir werden Ihnen detaillierte Informationen über erweiterte Support-Optionen, einschließlich aller zusätzlichen Kosten und der spezifischen Support-Abdeckung, mitteilen.