

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Catatan SageMaker HyperPod rilis Amazon
<a name="sagemaker-hyperpod-release-notes"></a>

Topik ini mencakup catatan rilis yang melacak pembaruan, perbaikan, dan fitur baru untuk Amazon SageMaker HyperPod. Jika Anda mencari rilis fitur umum, pembaruan, dan peningkatan untuk Amazon SageMaker HyperPod, Anda mungkin menemukan halaman ini bermanfaat.

Rilis HyperPod AMI didokumentasikan secara terpisah untuk menyertakan informasi komponen utama termasuk rilis AMI umum, versi, dan dependensi. Jika Anda mencari informasi ini terkait dengan rilis HyperPod AMI, lihat[Amazon SageMaker HyperPod AMI](sagemaker-hyperpod-release-ami.md).

## SageMaker HyperPod catatan rilis: 16 April 2026
<a name="sagemaker-hyperpod-release-notes-20260416"></a>

SageMaker HyperPod merilis yang berikut ini untuk[Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md).

**Fitur baru**
+ **Grup instans fleksibel** - Anda sekarang dapat membuat grup instance dengan beberapa jenis instance menggunakan `InstanceRequirements` parameter baru. Ini memungkinkan penyediaan berbasis prioritas, di mana HyperPod upaya untuk menyediakan jenis instans prioritas tertinggi terlebih dahulu dan kembali ke tipe prioritas lebih rendah jika kapasitas tidak tersedia. Grup instans yang fleksibel menyederhanakan konfigurasi auto-scaling Karpenter dengan mengurangi jumlah grup instans yang dibutuhkan. Anda dapat menentukan hingga 20 jenis instans per grup instans. Untuk informasi selengkapnya, lihat [Grup instans yang fleksibel](sagemaker-hyperpod-scaling-eks.md#sagemaker-hyperpod-scaling-eks-flexible-ig).

## SageMaker HyperPod catatan rilis: 25 Januari 2026
<a name="sagemaker-hyperpod-release-notes-20260125"></a>

SageMaker HyperPod merilis yang berikut ini untuk[Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md).

**Fitur baru**
+ Merilis SageMaker HyperPod AMI baru untuk Amazon EKS 1.34. Untuk informasi selengkapnya, lihat [SageMaker Rilis Hyperpod AMI untuk Amazon EKS: 25 Januari 2026](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20260125).

Untuk informasi lebih lanjut, lihat [Kubernetes v1.34](https://kubernetes.io/blog/2025/08/27/kubernetes-v1-34-release/).

## SageMaker HyperPod catatan rilis: 07 November 2025
<a name="sagemaker-hyperpod-release-notes-20251107"></a>

SageMaker HyperPod merilis yang berikut ini untuk[Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md).

**Fitur baru**
+ [SageMaker HyperPod Rilis AMI untuk Amazon EKS: 07 November 2025](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20251107)Patch keamanan yang ditingkatkan.

## SageMaker HyperPod catatan rilis: 29 September 2025
<a name="sagemaker-hyperpod-release-notes-20250929"></a>

SageMaker HyperPod merilis yang berikut ini untuk[Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md).

**Fitur baru**
+ Merilis SageMaker HyperPod AMI baru untuk Amazon EKS 1.33. Untuk informasi selengkapnya, lihat [SageMaker HyperPod Rilis AMI untuk Amazon EKS: 29 September 2025](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20250929).
**penting**  
Dynamic Resource Allocation beta Kubernetes API diaktifkan secara default dalam rilis ini.  
API ini meningkatkan penjadwalan dan pemantauan beban kerja yang membutuhkan sumber daya seperti. GPUs
API ini dikembangkan oleh komunitas Kubernetes open source dan mungkin berubah di Kubernetes versi masa depan. Sebelum Anda menggunakan API, tinjau [dokumentasi Kubernetes](https://kubernetes.io/docs/concepts/scheduling-eviction/dynamic-resource-allocation/) dan pahami bagaimana hal itu memengaruhi beban kerja Anda.
HyperPod tidak merilis HyperPod Amazon Linux 2 AMI untuk Kubernetes 1.33. AWS merekomendasikan agar Anda bermigrasi ke AL2023. Untuk informasi selengkapnya, lihat [Memutakhirkan dari Amazon Linux 2 ke AL2023](https://docs.aws.amazon.com/eks/latest/userguide/al2023.html).

Untuk informasi lebih lanjut, lihat [Kubernetes v1.33](https://kubernetes.io/blog/2025/04/23/kubernetes-v1-33-release/).

## SageMaker HyperPod catatan rilis: 4 Agustus 2025
<a name="sagemaker-hyperpod-release-notes-20250804"></a>

SageMaker HyperPod merilis publik baru AMIs untuk orkestrasi EKS. Publik AMIs dapat digunakan sendiri, atau mereka dapat digunakan untuk membuat kustom AMIs. Untuk informasi lebih lanjut tentang publik AMIs, lihat[Rilis AMI publik](sagemaker-hyperpod-release-public-ami.md). Untuk informasi selengkapnya tentang membuat AMI kustom, lihat[Gambar Mesin Amazon Kustom (AMIs) untuk SageMaker HyperPod cluster](hyperpod-custom-ami-support.md). 

## SageMaker HyperPod catatan rilis: 31 Juli 2025
<a name="sagemaker-hyperpod-release-notes-20250731"></a>

SageMaker HyperPod merilis yang berikut ini untuk[Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md).

**Fitur dan peningkatan baru**
+ Merilis AMI baru yang memperbarui sistem operasi dari Amazon Linux 2 ke Amazon Linux 2023 untuk kluster EKS. Peningkatan utama termasuk Linux Kernel 6.1, Python 3.10, NVIDIA Driver 560.35.03, dan manajer paket DNF menggantikan YUM.
**penting**  
Pembaruan dari Amazon Linux 2 untuk AL2023 memperkenalkan perubahan signifikan yang mungkin memengaruhi kompatibilitas dengan perangkat lunak dan konfigurasi yang dirancang untuknya. AL2 Kami sangat menyarankan untuk menguji aplikasi Anda AL2023 sebelum memutakhirkan klaster Anda sepenuhnya.

  Untuk informasi selengkapnya tentang AMI baru dan cara meningkatkan klaster Anda, lihat[SageMaker HyperPod Rilis AMI untuk Amazon EKS: 31 Juli 2025](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20250731).

## SageMaker HyperPod catatan rilis: 13 Mei 2025
<a name="sagemaker-hyperpod-release-notes-20250513"></a>

SageMaker HyperPod merilis yang berikut ini untuk[Mengatur cluster dengan Slurm SageMaker HyperPodOrkestrasi slurm](sagemaker-hyperpod-slurm.md).

**Fitur dan peningkatan baru**
+ Merilis AMI yang diperbarui yang mendukung Ubuntu 22.04 LTS untuk cluster Slurm. Rilis ini mencakup beberapa peningkatan komponen sistem dan perangkat lunak untuk memberikan peningkatan kinerja, fitur yang diperbarui, dan keamanan yang ditingkatkan.
**penting**  
Pembaruan dari Ubuntu 20.04 LTS ke Ubuntu 22.04 LTS memperkenalkan perubahan yang mungkin memengaruhi kompatibilitas dengan perangkat lunak dan konfigurasi yang dirancang untuk Ubuntu 20.04.

  Untuk informasi lebih lanjut, lihat:
  + [Pembaruan utama di Ubuntu 22.04 AMI](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-ami-slurm-ubuntu22-updates)
  + [Upgrade ke Ubuntu 22.04 AMI](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-ami-slurm-ubuntu22-upgrade)
  + [Memecahkan masalah kegagalan pemutakhiran](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-ami-slurm-ubuntu22-troubleshoot)

## SageMaker HyperPod catatan rilis: 1 Mei 2025
<a name="sagemaker-hyperpod-release-notes-20250501"></a>

SageMaker HyperPod merilis yang berikut ini untuk[Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md).

**Fitur baru**
+ Menambahkan pelaporan penggunaan untuk kluster yang diatur EKS, memungkinkan organisasi untuk menerapkan alokasi biaya berbasis penggunaan yang transparan di seluruh tim, proyek, atau departemen. Fitur ini melengkapi fungsi HyperPod [Tata Kelola Tugas](sagemaker-hyperpod-eks-operate-console-ui-governance.md) untuk memastikan distribusi biaya yang adil di lingkungan AI/ML multi-penyewa bersama. Untuk informasi selengkapnya, lihat [Melaporkan Penggunaan Komputasi di HyperPod](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-usage-reporting.html).

## SageMaker HyperPod catatan rilis: 28 April 2025
<a name="sagemaker-hyperpod-release-notes-20250428"></a>

SageMaker HyperPod merilis yang berikut untuk [Mengatur cluster dengan Slurm SageMaker HyperPodOrkestrasi slurm](sagemaker-hyperpod-slurm.md) dan[Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md).

**Fitur dan peningkatan baru**
+ Driver NVIDIA yang ditingkatkan dari versi 550.144.03 ke 550.163.01. Peningkatan ini untuk mengatasi Kerentanan dan Eksposur Umum (CVEs) yang ada di [Buletin Keamanan Tampilan GPU NVIDIA](https://nvidia.custhelp.com/app/answers/detail/a_id/5630) untuk April 2025.

Untuk informasi tentang rilis AMI terkait, lihat [SageMaker HyperPod Rilis AMI untuk Slurm: 28 April 2025](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20250428) dan[SageMaker HyperPod Rilis AMI untuk Amazon EKS: 28 April 2025](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20250428).

## SageMaker HyperPod catatan rilis: 18 April 2025
<a name="sagemaker-hyperpod-release-notes-20250418"></a>

SageMaker HyperPod merilis yang berikut ini untuk[Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md).

**Fitur baru**
+ Merilis SageMaker HyperPod AMI baru untuk Amazon EKS 1.32.1. Untuk informasi selengkapnya, lihat [SageMaker HyperPod Rilis AMI untuk Amazon EKS: 18 April 2025](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20250418).

## SageMaker HyperPod catatan rilis: 10 April 2025
<a name="sagemaker-hyperpod-release-notes-20250410"></a>

SageMaker HyperPod merilis yang berikut ini untuk[Mengatur cluster dengan Slurm SageMaker HyperPodOrkestrasi slurm](sagemaker-hyperpod-slurm.md).

**Fitur dan peningkatan baru**
+ Menambahkan tutorial resep Direct Preference Optimization (DPO) untuk SageMaker HyperPod orkestrasi Slurm. Tutorial fine-tuning ini memberikan step-by-step panduan untuk mengoptimalkan penyelarasan model menggunakan metode DPO pada cluster Slurm bertenaga GPU. SageMaker HyperPod Untuk informasi selengkapnya, lihat [HyperPod Tutorial DPO klaster slurm (GPU)](hyperpod-gpu-slurm-dpo-tutorial.md).

## SageMaker HyperPod catatan rilis: 03 April 2025
<a name="sagemaker-hyperpod-release-notes-20250403"></a>

SageMaker HyperPod merilis yang berikut untuk [Mengatur cluster dengan Slurm SageMaker HyperPodOrkestrasi slurm](sagemaker-hyperpod-slurm.md) dan[Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md).

**Fitur dan peningkatan baru**
+ Menambahkan halaman [Quickstart](sagemaker-hyperpod-quickstart.md) untuk menyebarkan cluster SageMaker HyperPod . Halaman ini memanfaatkan alur kerja penyiapan yang disederhanakan dari SageMaker HyperPod lokakarya khusus dan mengotomatiskan penerapan menggunakan templat bawaan. AWS CloudFormation Ini mendukung preferensi infrastruktur seperti Slurm atau Amazon EKS, untuk konfigurasi yang mudah dan penyebaran cluster dasar.
+ SageMaker HyperPod sekarang mendukung jenis instance berikut untuk cluster Slurm dan Amazon EKS.
  + Jenis instans baru: instance I3en, M7i, R7i. Untuk daftar lengkap instance yang didukung, lihat `InstanceType` bidang di. `[ClusterInstanceGroupDetails](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupDetails.html)`

## SageMaker HyperPod catatan rilis: 16 Maret 2025
<a name="sagemaker-hyperpod-release-notes-20250316"></a>

SageMaker HyperPod merilis yang berikut untuk [Mengatur cluster dengan Slurm SageMaker HyperPodOrkestrasi slurm](sagemaker-hyperpod-slurm.md) dan[Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md).

**Fitur dan peningkatan baru**
+ Menambahkan kunci kondisi IAM berikut untuk kontrol akses yang lebih terperinci dalam operasi [https://docs.aws.amazon.com//sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com//sagemaker/latest/APIReference/API_CreateCluster.html)dan [https://docs.aws.amazon.com//sagemaker/latest/APIReference/API_UpdateCluster.html](https://docs.aws.amazon.com//sagemaker/latest/APIReference/API_UpdateCluster.html)API.    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/sagemaker/latest/dg/sagemaker-hyperpod-release-notes.html)

## SageMaker HyperPod catatan rilis: 20 Februari 2025
<a name="sagemaker-hyperpod-release-notes-20250220"></a>

SageMaker HyperPod merilis yang berikut untuk [Mengatur cluster dengan Slurm SageMaker HyperPodOrkestrasi slurm](sagemaker-hyperpod-slurm.md) dan[Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md).

**Fitur dan peningkatan baru**
+ Menambahkan dukungan untuk menghapus grup instans dari SageMaker HyperPod cluster Anda. Untuk informasi lebih lanjut, lihat [Hapus grup instance](smcluster-scale-down.md#smcluster-remove-instancegroup) dari kluster yang diatur EKS dan untuk cluster yang diatur Slurm. [Turunkan skala cluster](sagemaker-hyperpod-operate-slurm-cli-command.md#sagemaker-hyperpod-operate-slurm-cli-command-scale-down) 

## SageMaker HyperPod catatan rilis: 18 Februari 2025
<a name="sagemaker-hyperpod-release-notes-20250218"></a>

SageMaker HyperPod merilis yang berikut untuk [Mengatur cluster dengan Slurm SageMaker HyperPodOrkestrasi slurm](sagemaker-hyperpod-slurm.md) dan[Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md).

**Fitur baru**
+ Rilis ini SageMaker HyperPod menggabungkan pembaruan keamanan dari toolkit kontainer Nvidia (dari versi 1.17.3 ke versi 1.17.4). Untuk informasi selengkapnya, lihat [catatan rilis v1.17.4](https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.17.4). 
**catatan**  
Untuk semua beban kerja kontainer di toolkit kontainer Nvidia versi 1.17.4, pemasangan pustaka kompatibilitas CUDA sekarang dinonaktifkan. Untuk memastikan kompatibilitas dengan beberapa versi CUDA pada alur kerja kontainer, perbarui `LD_LIBRARY_PATH` untuk menyertakan pustaka kompatibilitas CUDA Anda. Anda dapat menemukan langkah-langkah spesifik di[Jika Anda menggunakan lapisan kompatibilitas CUDA](inference-gpu-drivers.md#collapsible-cuda-compat).

Untuk informasi tentang rilis AMI terkait, lihat [SageMaker HyperPod Rilis AMI untuk Slurm: 18 Februari 2025](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20250218) dan[SageMaker HyperPod Rilis AMI untuk Amazon EKS: 18 Februari 2025](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20250218).

## SageMaker HyperPod catatan rilis: 06 Februari 2025
<a name="sagemaker-hyperpod-release-notes-20250206"></a>

SageMaker HyperPod merilis yang berikut untuk [Mengatur cluster dengan Slurm SageMaker HyperPodOrkestrasi slurm](sagemaker-hyperpod-slurm.md) dan[Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md).

**Fitur dan peningkatan baru**
+ Dukungan SageMaker HyperPod Multi-AZ yang disempurnakan: Anda dapat menentukan subnet dan grup keamanan yang berbeda, melintasi Availability Zone yang berbeda, untuk grup instans individual dalam klaster Anda. Untuk informasi selengkapnya tentang dukungan SageMaker HyperPod Multi-AZ, lihat[Menyiapkan SageMaker HyperPod cluster di beberapa AZs](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-multiple-availability-zones).

## SageMaker HyperPod catatan rilis: 22 Januari 2025
<a name="sagemaker-hyperpod-release-notes-20250122"></a>

**Rilis AMI**
+ [SageMaker HyperPod Rilis AMI untuk Amazon EKS: 22 Januari 2025](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20250122)

## SageMaker HyperPod catatan rilis: 09 Januari 2025
<a name="sagemaker-hyperpod-release-notes-20250109"></a>

SageMaker HyperPod merilis yang berikut untuk [Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md) dan[Mengatur cluster dengan Slurm SageMaker HyperPodOrkestrasi slurm](sagemaker-hyperpod-slurm.md).

**Fitur dan peningkatan baru**
+  IPv6 Dukungan tambahan: Cluster dapat menggunakan IPv6 pengalamatan saat dikonfigurasi dengan VPC dan subnet yang IPv6 diaktifkan. Untuk informasi selengkapnya, lihat [Menyiapkan SageMaker HyperPod dengan VPC Amazon khusus](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-vpc).

## SageMaker HyperPod catatan rilis: 21 Desember 2024
<a name="sagemaker-hyperpod-release-notes-20241221"></a>

SageMaker HyperPod merilis yang berikut untuk [Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md) dan[Mengatur cluster dengan Slurm SageMaker HyperPodOrkestrasi slurm](sagemaker-hyperpod-slurm.md).

**Fitur baru**
+ SageMaker HyperPod sekarang mendukung jenis instance berikut untuk cluster Slurm dan Amazon EKS.
  + Jenis contoh baru: C6gn, C6i, M6i, R6i.
  + Jenis instans Trainium baru: Trn1 dan Trn1n.

**Perbaikan**
+ Meningkatkan visibilitas pencatatan kesalahan saat Slurm mengganggu pekerjaan, dan mencegah penghentian langkah pekerjaan yang tidak perlu selama pembatalan pekerjaan yang dimulai oleh Slurm.
+ DLAMI dasar yang diperbarui untuk p5en untuk cluster Slurm dan Amazon EKS.

**Rilis AMI**
+ [SageMaker HyperPod Rilis AMI untuk Slurm: 21 Desember 2024](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20241221)
+ [SageMaker HyperPod Rilis AMI untuk Amazon EKS: 21 Desember 2024](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241221)

## SageMaker HyperPod catatan rilis: 13 Desember 2024
<a name="sagemaker-hyperpod-release-notes-20241213"></a>

SageMaker HyperPod merilis yang berikut untuk [Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md) dan[Mengatur cluster dengan Slurm SageMaker HyperPodOrkestrasi slurm](sagemaker-hyperpod-slurm.md).

**Fitur baru**
+ SageMaker HyperPod merilis satu set CloudWatch metrik Amazon untuk memantau kesehatan dan kinerja cluster SageMaker HyperPod Slurm. Metrik ini terkait dengan CPU, GPU, pemanfaatan memori, dan informasi instance cluster seperti jumlah node dan node gagal. Fitur pemantauan ini diaktifkan secara default, dan metrik dapat diakses di bawah `/aws/sagemaker/Clusters` CloudWatch namespace. Anda juga dapat mengatur CloudWatch alarm berdasarkan metrik ini untuk secara proaktif mendeteksi dan mengatasi potensi masalah dalam cluster berbasis Slurm mereka. HyperPod Untuk informasi selengkapnya, lihat [Metrik Amazon SageMaker HyperPod Slurm](smcluster-slurm-metrics.md).

**Rilis AMI**
+ [SageMaker HyperPod Rilis AMI untuk Amazon EKS: 13 Desember 2024](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241213)

## SageMaker HyperPod catatan rilis: 24 November 2024
<a name="sagemaker-hyperpod-release-notes-20241124"></a>

SageMaker HyperPod merilis yang berikut untuk [Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md) dan[Mengatur cluster dengan Slurm SageMaker HyperPodOrkestrasi slurm](sagemaker-hyperpod-slurm.md).

**Fitur baru**
+ Menambahkan dukungan untuk mengonfigurasi SageMaker HyperPod cluster di beberapa Availability Zone. Untuk informasi selengkapnya tentang dukungan SageMaker HyperPod Multi-AZ, lihat[Menyiapkan SageMaker HyperPod cluster di beberapa AZs](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-multiple-availability-zones).

**Rilis AMI**
+ [SageMaker HyperPod Rilis AMI untuk Slurm: 24 November 2024](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20241124)
+ [SageMaker HyperPod Rilis AMI untuk Amazon EKS: 24 November 2024](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241124)

## SageMaker HyperPod catatan rilis: 15 November 2024
<a name="sagemaker-hyperpod-release-notes-20241115"></a>

SageMaker HyperPod merilis yang berikut untuk [Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md) dan[Mengatur cluster dengan Slurm SageMaker HyperPodOrkestrasi slurm](sagemaker-hyperpod-slurm.md). Untuk informasi selengkapnya, lihat [SageMaker HyperPod Rilis AMI untuk Amazon EKS: 15 November 2024](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241115) dan .

**Fitur dan peningkatan baru**
+ Menambahkan dukungan untuk jenis instans trn1 dan trn1n untuk kluster orkestrasi Amazon EKS dan Slurm.
+ Peningkatan manajemen log untuk klaster Slurm:
  +  Rotasi log yang diterapkan: mingguan atau harian berdasarkan ukuran.
  +  Atur retensi log ke 3 minggu.
  +  Log terkompresi untuk mengurangi dampak penyimpanan.
  +  Lanjutkan mengunggah log CloudWatch untuk retensi jangka panjang.
**catatan**  
Beberapa log masih disimpan di syslog.
+ Pengaturan Bit Lancar yang Disesuaikan untuk mencegah masalah pelacakan dengan file yang berisi baris panjang.

**Perbaikan bug**
+ Mencegah pemotongan yang tidak diinginkan dengan pembaruan node pengontrol Slurm dalam file konfigurasi. `slurm.config`

**Rilis AMI**
+ [SageMaker HyperPod Rilis AMI untuk Slurm: 15 November 2024](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20241115)
+ [SageMaker HyperPod Rilis AMI untuk Amazon EKS: 15 November 2024](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241115)

## SageMaker HyperPod catatan rilis: 11 November 2024
<a name="sagemaker-hyperpod-release-notes-20241111"></a>

SageMaker HyperPod merilis yang berikut untuk [Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md) dan[Mengatur cluster dengan Slurm SageMaker HyperPodOrkestrasi slurm](sagemaker-hyperpod-slurm.md). 

**Fitur baru**
+ SageMaker HyperPod AMI sekarang mendukung tipe instans G6e.

**Rilis AMI**
+ [SageMaker HyperPod Rilis AMI untuk Slurm: 11 November 2024](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20241111)
+ [SageMaker HyperPod Rilis AMI untuk Amazon EKS: 11 November 2024](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241111)

## SageMaker HyperPod catatan rilis: 31 Oktober 2024
<a name="sagemaker-hyperpod-release-notes-20241031"></a>

SageMaker HyperPod merilis yang berikut untuk [Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md) dan[Mengatur cluster dengan Slurm SageMaker HyperPodOrkestrasi slurm](sagemaker-hyperpod-slurm.md).

**Fitur baru**
+ Menambahkan penskalaan SageMaker HyperPod klaster pada tingkat grup instans dan tingkat instans untuk kluster orkestrasi Amazon EKS dan Slurm. Untuk informasi selengkapnya tentang mengurangi kluster Amazon EKS, lihat. [Penskalaan cluster SageMaker HyperPod](smcluster-scale-down.md) Untuk informasi selengkapnya tentang penskalaan cluster Slurm, lihat *Scale down a* cluster in. [Mengelola cluster SageMaker HyperPod Slurm menggunakan AWS CLI](sagemaker-hyperpod-operate-slurm-cli-command.md)
+ SageMaker HyperPod sekarang mendukung jenis instans P5e untuk kluster yang diatur Amazon EKS dan Slurm. 

## SageMaker HyperPod catatan rilis: 21 Oktober 2024
<a name="sagemaker-hyperpod-release-notes-20241021"></a>

SageMaker HyperPod merilis yang berikut untuk [Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md) dan[Mengatur cluster dengan Slurm SageMaker HyperPodOrkestrasi slurm](sagemaker-hyperpod-slurm.md).

**Fitur baru**
+ SageMaker HyperPod sekarang mendukung tipe instance P5e [n], G6, Gr6, dan Trn2 [n] untuk cluster Slurm dan Amazon EKS.

**Rilis AMI**
+ [SageMaker HyperPod Rilis AMI untuk Slurm: 21 Oktober 2024](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20241021)
+ [SageMaker HyperPod Rilis AMI untuk Amazon EKS: 21 Oktober 2024](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241021)

## SageMaker HyperPod catatan rilis: 10 September 2024
<a name="sagemaker-hyperpod-release-notes-20240910"></a>

SageMaker HyperPod merilis yang berikut untuk [Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md) dan[Mengatur cluster dengan Slurm SageMaker HyperPodOrkestrasi slurm](sagemaker-hyperpod-slurm.md).

**Fitur baru**
+ Menambahkan dukungan Amazon EKS di SageMaker HyperPod. Untuk mempelajari selengkapnya, lihat [Mengatur SageMaker HyperPod cluster dengan Amazon EKS](sagemaker-hyperpod-eks.md).
+ Menambahkan dukungan untuk mengelola SageMaker HyperPod cluster melalui CloudFormation dan Terraform. Untuk informasi selengkapnya tentang mengelola HyperPod klaster CloudFormation, lihat [CloudFormation dokumentasi untuk `AWS::SageMaker::Cluster`](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/aws-resource-sagemaker-cluster.html). [Untuk mempelajari tentang mengelola HyperPod cluster melalui Terraform, lihat Dokumentasi Terraform untuk. `awscc_sagemaker_cluster`](https://registry.terraform.io/providers/hashicorp/awscc/latest/docs/data-sources/sagemaker_cluster)

**Rilis AMI**
+ [SageMaker HyperPod Rilis AMI untuk Slurm: 10 September 2024](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20240910)
+ [SageMaker HyperPod Rilis AMI untuk Amazon EKS: 10 September 2024](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20240910)

## SageMaker HyperPod catatan rilis: 20 Agustus 2024
<a name="sagemaker-hyperpod-release-notes-20240820"></a>

SageMaker HyperPod merilis yang berikut ini untuk[Mengatur cluster dengan Slurm SageMaker HyperPod](sagemaker-hyperpod-slurm.md).

**Fitur baru**
+ Meningkatkan [fungsionalitas SageMaker HyperPod auto-resume](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-resiliency-slurm.html#sagemaker-hyperpod-resiliency-slurm-auto-resume), memperluas kemampuan ketahanan untuk node Slurm yang terpasang dengan Generic (GRES). RESources 

  Ketika [Generic Resources (GRES)](https://slurm.schedmd.com/gres.html) dilampirkan ke node Slurm, Slurm biasanya tidak mengizinkan perubahan dalam alokasi node, seperti mengganti node, dan dengan demikian tidak memungkinkan untuk melanjutkan pekerjaan yang gagal. Kecuali dilarang secara eksplisit, fungsionalitas HyperPod auto-resume secara otomatis mengantri ulang pekerjaan yang salah yang terkait dengan node berkemampuan GRES. Proses ini melibatkan menghentikan pekerjaan, menempatkannya kembali ke antrian pekerjaan, dan kemudian memulai kembali pekerjaan dari awal.

**Perubahan lainnya**
+ Pra-paket [https://slurm.schedmd.com/slurmrestd.html](https://slurm.schedmd.com/slurmrestd.html)dalam AMI SageMaker HyperPod .
+ Mengubah nilai default untuk `ResumeTimeout` dan `UnkillableStepTimeout` dari 60 detik menjadi 300 detik `slurm.conf` untuk meningkatkan respon sistem dan penanganan pekerjaan.
+ Membuat perbaikan kecil pada pemeriksaan kesehatan untuk NVIDIA Data Center GPU Manager (DCGM) dan The NVIDIA System Management Interface (nvidia-smi).

**Perbaikan bug**
+ Plug-in HyperPod auto-resume dapat menggunakan node idle untuk melanjutkan pekerjaan.

## SageMaker HyperPod catatan rilis: 20 Juni 2024
<a name="sagemaker-hyperpod-release-notes-20240620"></a>

SageMaker HyperPod merilis yang berikut ini untuk[Mengatur cluster dengan Slurm SageMaker HyperPod](sagemaker-hyperpod-slurm.md).

**Fitur baru**
+ Menambahkan kemampuan baru untuk melampirkan penyimpanan tambahan ke instance SageMaker HyperPod cluster. Dengan kemampuan ini, Anda dapat mengonfigurasi penyimpanan tambahan pada tingkat konfigurasi grup instans selama proses pembuatan atau pembaruan klaster, baik melalui SageMaker HyperPod konsol atau [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html)dan [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateCluster.html) APIs. Volume EBS tambahan dilampirkan ke setiap instance dalam SageMaker HyperPod cluster dan dipasang ke`/opt/sagemaker`. Untuk mempelajari lebih lanjut tentang mengimplementasikannya di SageMaker HyperPod klaster Anda, lihat dokumentasi yang diperbarui pada halaman berikut.
  + [Memulai dengan SageMaker HyperPod](smcluster-getting-started-slurm.md)
  + [SageMaker HyperPod Operasi klaster slurm](sagemaker-hyperpod-operate-slurm.md)

  Perhatikan bahwa Anda perlu memperbarui perangkat lunak HyperPod cluster untuk menggunakan kemampuan ini. Setelah menambal perangkat lunak HyperPod cluster, Anda dapat memanfaatkan kemampuan ini untuk SageMaker HyperPod cluster yang ada yang dibuat sebelum 20 Juni 2024 dengan menambahkan grup instans baru. Kemampuan ini sepenuhnya efektif untuk setiap SageMaker HyperPod cluster yang dibuat setelah 20 Juni 2024.

**Langkah-langkah upgrade**
+ Jalankan perintah berikut untuk memanggil [UpdateClusterSoftware](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateClusterSoftware.html)API untuk memperbarui HyperPod cluster yang ada dengan HyperPod DLAMI terbaru. Untuk menemukan petunjuk lebih lanjut, lihat[Perbarui perangkat lunak SageMaker HyperPod platform cluster](sagemaker-hyperpod-operate-slurm-cli-command.md#sagemaker-hyperpod-operate-slurm-cli-command-update-cluster-software). 
**penting**  
Cadangkan pekerjaan Anda sebelum menjalankan API ini. Proses patching menggantikan volume root dengan AMI yang diperbarui, yang berarti bahwa data Anda sebelumnya yang disimpan dalam volume root instance akan hilang. Pastikan Anda mencadangkan data dari volume root instance ke Amazon S3 atau Amazon FSx for Lustre. Untuk informasi selengkapnya, lihat [Gunakan skrip cadangan yang disediakan oleh SageMaker HyperPod](sagemaker-hyperpod-operate-slurm-cli-command.md#sagemaker-hyperpod-operate-slurm-cli-command-update-cluster-software-backup).

  ```
   aws sagemaker update-cluster-software --cluster-name your-cluster-name
  ```
**catatan**  
Perhatikan bahwa Anda harus menjalankan AWS CLI perintah untuk memperbarui HyperPod cluster Anda. Memperbarui HyperPod perangkat lunak melalui UI SageMaker HyperPod konsol saat ini tidak tersedia.

## SageMaker HyperPod catatan rilis: 24 April 2024
<a name="sagemaker-hyperpod-release-notes-20240424"></a>

SageMaker HyperPod merilis yang berikut ini untuk[Mengatur cluster dengan Slurm SageMaker HyperPod](sagemaker-hyperpod-slurm.md).

**Perbaikan bug**
+ Memperbaiki bug dengan `ThreadsPerCore` parameter di [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html)API. Dengan perbaikan, [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html)dan [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateCluster.html) APIs dengan benar mengambil dan menerapkan input pengguna melalui`ThreadsPerCore`. Perbaikan ini efektif pada HyperPod cluster yang dibuat setelah 24 April 2024. Jika Anda memiliki masalah dengan bug ini dan ingin perbaikan ini diterapkan ke cluster Anda, Anda perlu membuat cluster baru. Pastikan Anda membuat cadangan dan memulihkan pekerjaan Anda saat pindah ke cluster baru mengikuti instruksi di[Gunakan skrip cadangan yang disediakan oleh SageMaker HyperPod](sagemaker-hyperpod-operate-slurm-cli-command.md#sagemaker-hyperpod-operate-slurm-cli-command-update-cluster-software-backup).

## SageMaker HyperPod catatan rilis: 27 Maret 2024
<a name="sagemaker-hyperpod-release-notes-20240327"></a>

SageMaker HyperPod merilis yang berikut ini untuk[Mengatur cluster dengan Slurm SageMaker HyperPod](sagemaker-hyperpod-slurm.md).

**HyperPod perangkat lunak patch**

Tim HyperPod layanan mendistribusikan patch perangkat lunak melalui. [SageMaker HyperPod DLAMI](sagemaker-hyperpod-ref.md#sagemaker-hyperpod-ref-hyperpod-ami) Lihat detail berikut tentang HyperPod DLAMI terbaru.
+ Dalam rilis HyperPod DLAMI ini, Slurm dibangun dengan layanan REST `slurmestd` () dengan dukungan JSON, YAMAL, dan JWT.
+ [Slurm](https://slurm.schedmd.com/documentation.html) yang ditingkatkan ke v23.11.3.

**Perbaikan**
+ Peningkatan batas waktu layanan auto-resume menjadi 60 menit.
+ Proses penggantian instance yang ditingkatkan untuk tidak memulai ulang pengontrol Slurm.
+ Pesan kesalahan yang disempurnakan dari menjalankan skrip siklus hidup, seperti kesalahan unduhan dan kesalahan pemeriksaan kesehatan instance saat memulai instance.

**Perbaikan bug**
+ Memperbaiki bug dengan layanan chrony yang menyebabkan masalah dengan sinkronisasi waktu.
+ Memperbaiki bug dengan parsing`slurm.conf`.
+ Memperbaiki masalah dengan `go-dcgm` perpustakaan [NVIDIA](https://github.com/NVIDIA/go-dcgm).

## SageMaker HyperPod catatan rilis: 14 Maret 2024
<a name="sagemaker-hyperpod-release-notes-20240314"></a>

SageMaker HyperPod merilis yang berikut ini untuk[Mengatur cluster dengan Slurm SageMaker HyperPod](sagemaker-hyperpod-slurm.md).

**Perbaikan**
+ HyperPod sekarang benar mendukung melewati nama partisi yang disediakan melalui `provisioning_parameters.json` dan membuat partisi tepat berdasarkan input yang disediakan. Untuk informasi lebih lanjut tentang`provisioning_parameters.json`, lihat [Konfigurasi lama: provisioning\$1parameters.json](sagemaker-hyperpod-ref.md#sagemaker-hyperpod-ref-provisioning-forms) dan[Menyesuaikan SageMaker HyperPod cluster menggunakan skrip siklus hidup](sagemaker-hyperpod-lifecycle-best-practices-slurm.md).

**Rilis AMI**
+ [SageMaker HyperPod Rilis AMI untuk Slurm: 14 Maret 2024](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20240314)

## SageMaker HyperPod catatan rilis: 15 Februari 2024
<a name="sagemaker-hyperpod-release-notes-20240215"></a>

SageMaker HyperPod merilis yang berikut ini untuk[Mengatur cluster dengan Slurm SageMaker HyperPod](sagemaker-hyperpod-slurm.md).

**Fitur baru**
+ Menambahkan `UpdateClusterSoftware` API baru untuk patch SageMaker HyperPod keamanan. Ketika patch keamanan tersedia, kami sarankan Anda untuk memperbarui SageMaker HyperPod cluster yang ada di akun Anda dengan menjalankan. `aws sagemaker update-cluster-software --cluster-name your-cluster-name` Untuk menindaklanjuti patch keamanan masa depan, terus lacak halaman catatan SageMaker HyperPod rilis Amazon ini. Untuk mempelajari cara kerja `UpdateClusterSoftware` API, lihat[Perbarui perangkat lunak SageMaker HyperPod platform cluster](sagemaker-hyperpod-operate-slurm-cli-command.md#sagemaker-hyperpod-operate-slurm-cli-command-update-cluster-software).

## SageMaker HyperPod catatan rilis: 29 November 2023
<a name="sagemaker-hyperpod-release-notes-20231129"></a>

SageMaker HyperPod merilis yang berikut ini untuk[Mengatur cluster dengan Slurm SageMaker HyperPod](sagemaker-hyperpod-slurm.md).

**Fitur baru**
+ Meluncurkan Amazon SageMaker HyperPod di AWS re:Invent 2023.

**Rilis AMI**
+ [SageMaker HyperPod Rilis AMI untuk Slurm: 29 November 2023](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20231129)