

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# DLAMIs的重要 NVIDIA 驅動程式變更
<a name="important-changes"></a>

在 2023 年 11 月 15 日，對 AWS 深度學習 AMIs (DLAMI) AWS 進行了與 DLAMIs 使用的 NIVIDA 驅動程式相關的重要變更。如需變更內容及其是否影響 DLAMIs使用的資訊，請參閱 [DLAMI NVIDIA 驅動程式變更FAQs](#important-changes-faq)。

## DLAMI NVIDIA 驅動程式變更FAQs
<a name="important-changes-faq"></a>
+ [有何變更？](#important-changes-faq-changing)
+ [為什麼需要此變更？](#important-changes-faq-why)
+ [此變更影響了哪些 DLAMIs？](#important-changes-faq-impact)
+ [這對您來說意味著什麼？](#important-changes-faq-customer)
+ [較新的 DLAMIs是否會遺失任何功能？](#important-changes-faq-function)
+ [此變更是否會影響深度學習容器？](#important-changes-faq-dlc)

### 有何變更？
<a name="important-changes-faq-changing"></a>

我們將 DLAMIs分割成兩個不同的群組：
+ 使用 NVIDIA 專屬驅動程式DLAMIs （以支援 P3, P3dn, G3)
+ 使用 NVIDIA OSS 驅動程式DLAMIs （以支援 G4dn, G5, P4, P5)

因此，我們為每個兩個類別建立新的 DLAMIs，其中包含新的名稱和新的 AMI IDs。這些 DLAMIs*不可*互換。也就是說，一個群組DLAMIs 不支援另一個群組支援的執行個體。例如，支援 P5 的 DLAMI 不支援 G3，而支援 G3 的 DLAMI 不支援 P5。

![\[DLAMI 分叉\]](http://docs.aws.amazon.com/zh_tw/dlami/latest/devguide/images/dlami-fork.jpg)


### 為什麼需要此變更？
<a name="important-changes-faq-why"></a>

先前，NVIDIA GPUs DLAMIs 包含 NVIDIA 的專屬核心驅動程式。不過，上游 Linux 核心社群接受了一項變更，該變更會隔離 NVIDIA GPU 驅動程式等專屬核心驅動程式，避免與其他核心驅動程式通訊。此變更會停用 P4 和 P5 系列執行個體上的 GPUDirect RDMA，這是一種允許 GPUs 有效率地使用 EFA 進行分散式訓練的機制。因此，DLAMIs 現在使用針對開放原始碼 EFA 驅動程式連結的 OpenRM 驅動程式 (NVIDIA 開放原始碼驅動程式），以支援 G4dn,G5, P4 和 P5。不過，此 OpenRM 驅動程式不支援較舊的執行個體 （例如 P3 和 G3)。因此，為了確保我們繼續提供目前、高效能和安全的支援兩種執行個體類型的 DLAMIs，我們將 DLAMIs 分成兩個群組：一個使用 OpenRM 驅動程式 （支援 G4dn, G5, P4 和 P5)，另一個使用較舊的專屬驅動程式 （支援 P3, P3dn 和 G3)。

### 此變更影響了哪些 DLAMIs？
<a name="important-changes-faq-impact"></a>

此變更會影響所有 DLAMIs。

### 這對您來說意味著什麼？
<a name="important-changes-faq-customer"></a>

只要您在支援的 Amazon Elastic Compute Cloud (Amazon EC2) 執行個體類型上執行，所有 DLAMIs 都會繼續提供功能、效能和安全性。若要判斷 DLAMI 支援的 EC2 執行個體類型，請檢查該 DLAMI 的版本備註，然後尋找**支援的 EC2 執行個體**。如需目前支援的 DLAMI 選項清單及其版本備註的連結，請參閱 [深度學習 AMIs版本備註](appendix-ami-release-notes.md)。

此外，您必須使用 correct AWS Command Line Interface (AWS CLI) 命令來叫用目前的 DLAMIs。

對於支援 P3, P3dn 和 G3 的基本 DLAMIs，請使用下列命令：

```
aws ec2 describe-images --region us-east-1 --owners amazon \
--filters 'Name=name,Values=Deep Learning Base Proprietary Nvidia Driver AMI (Amazon Linux 2) Version ??.?' 'Name=state,Values=available' \
--query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
```

對於支援 G4dn, G5, P4 和 P5 的基本 DLAMIs，請使用下列命令：

```
aws ec2 describe-images --region us-east-1 --owners amazon \
--filters 'Name=name,Values=Deep Learning Base OSS Nvidia Driver AMI (Amazon Linux 2) Version ??.?' 'Name=state,Values=available' \
--query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
```

### 較新的 DLAMIs是否會遺失任何功能？
<a name="important-changes-faq-function"></a>

否，功能不會遺失。目前的 DLAMIs 提供先前 DLAMIs的所有功能、效能和安全性，前提是您在支援的 EC2 執行個體類型上執行它們。

### 此變更是否會影響深度學習容器？
<a name="important-changes-faq-dlc"></a>

否，此變更不會影響 AWS 深度學習容器，因為它們不包含 NVIDIA 驅動程式。不過，請務必在與基礎執行個體相容的 AMIs 上執行深度學習容器。