

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 開始使用 GPU 加速執行個體
<a name="gpu-instances-started"></a>

最新一代 GPU 加速執行個體類型，例如下列清單所示，可為深度學習及高效能運算 (HPC) 應用程式提供最高效能功能。選取執行個體類型連結，進一步了解其功能。
+ [P6 系列](https://aws.amazon.com/ec2/instance-types/p6/)
+ [P6 系列](https://aws.amazon.com/ec2/instance-types/p6/)
+ [P5 系列](https://aws.amazon.com/ec2/instance-types/p5/)

如需加速執行個體類型之執行個體類型規格的完整清單，請參閱「Amazon EC2 執行個體類型」**參考中的[加速運算](https://docs.aws.amazon.com/ec2/latest/instancetypes/ac.html)。

**軟體組態**  
開始使用最新一代 GPU 加速執行個體類型的最簡單方法是從預先設定所有必要軟體的 AWS 深度學習 AMI 啟動執行個體。如需搭配 GPU 加速執行個體類型使用的最新 AWS 深度學習 AMIs 相關資訊，請參閱《 *AWS 深度學習 AMIs 開發人員指南*》中的 [P6 支援的 DLAMI](https://docs.aws.amazon.com/dlami/latest/devguide/p6-support-dlami.html)。

如果您需要建置自訂 AMI 以啟動託管深度學習或 HPC 應用程式的執行個體，建議您在基礎映像上方安裝下列最低軟體版本。


| 執行個體類型 | NVIDIA 驅動程式 | CUDA | NVIDIA GDRCopy | EFA 安裝程式 | NCCL | EFA K8s ¹ | 
| --- | --- | --- | --- | --- | --- | --- | 
| G7e | 575 | 12.9 | 2.5 | 1.45.0 | 2.28.3 | 0.5.10 | 
| P5 | 530 | 12.1 | 2.3 | 1.24.1 | 2.18.3 | 0.4.4 | 
| P5.4xlarge | 530 | 12.1 | 2.3 | 1.43.1 ² | 2.18.3 | 0.4.4 | 
| P5e | 550 | 12.1 | 2.3 | 1.24.1 | 2.18.3 | 0.5.5 | 
| P5en | 550 | 12.1 | 2.3 | 1.24.1 | 2.18.3 | 0.5.6 | 
| P6-B200 | 570 | 12.8 | 2.5 | 1.41.0 | 2.26.2-1 | 0.5.10 | 
| P6e-GB200 | 570 | 12.8 | 2.5 | 1.41.0 | 2.26.2-1 | 0.5.10 | 
| P6-B300 | 580 | 13.0 | 2.5 | 1.44.0 | 2.28.3 | 0.5.10 | 

** ¹** **EFA K8s** 欄包含適用於 `aws-efa-k8s-device-plugin` 的最低建議版本。

** ²** 當 GPU 至 GPU 通訊使用 Elastic Fabric Adapter (EFA) 與 NVIDIA Collective Communications Library (NCCL) 時，存在影響 `P5.4xlarge` 執行個體的相容性問題。如需緩解此問題，設定環境變數 `FI_HMEM_DISABLE_P2P` 為 `1`，並確保安裝版本 EFA 1.43.1 或更新版本。

**注意**  
若使用 EFA 安裝程式版本 1.41.0，`aws-ofi-nccl plugin` 會隨附該版本。若是較舊 EFA 安裝程式版本，則使用 `aws-ofi-nccl plugin` 版本 `1.7.2-aws` 或更新版本。

我們也建議您將執行個體設定為不使用深層的 C-states。如需詳細資訊，請參閱「Amazon Linux 2 使用者指南」**中的[限制深層的 C-state 達到高效能與低延遲](https://docs.aws.amazon.com/linux/al2/ug/processor_state_control.html#c-states)。最新的 AWS 深度學習基礎 GPU AMIs已預先設定為不使用更深層的 C 狀態。

如需網路和 Elastic Fabric Adapter (EFA) 組態，請參閱 [使用多個網路卡最大化 Amazon EC2 執行個體的網路頻寬](efa-acc-inst-types.md)。