本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
PERF02-BP06 使用最佳化的硬體型運算加速器
使用硬體加速器執行特定功能,比以 CPU 為基礎的替代方案更有效率。
常見的反模式:
-
在工作負載中,您尚未基準化分析一般用途執行個體和專用執行個體,而專用執行個體可以改善效能和降低成本。
-
您使用硬體型運算加速器來執行任務,比起使用以 CPU 為基礎的替代方案更有效率。
-
未監控 GPU 使用率。
建立此最佳實務的優勢:透過使用硬體型加速器,例如圖形處理單元 (GPU) 和現場可程式化閘道陣列 (FPGA),您就可以更有效率地執行特定處理功能。
未建立此最佳實務時的曝險等級:中
實作指引
加速運算執行個體可讓您存取硬體型運算加速器,例如 GPU 和 FPGA。這些硬體加速器比基於 CPU 的替代品更有效地執行某些功能,例如圖形處理或資料模式匹配。許多加速的工作負載 (例如轉譯、轉碼和機器學習) 在資源使用方面變化很大。只在需要時執行此硬體,並在不需要時自動停用它們,以提高整體效能的效率。
實作步驟
-
確定哪些加速運算執行個體可以滿足您的需求。
-
針對機器學習工作負載,請利用專供工作負載使用的專用硬體,例如 AWS Trainium
、AWS Inferentia 和 Amazon EC2 DL1 。AWS與同類 Amazon EC2 執行個體相比,Inferentia 執行個體 (例如 Inf2 執行個體) 所提供的效能功耗比要高出 50% 。 -
收集加速運算執行個體的用量指標。例如,可以使用 CloudWatch 代理程式為您的 GPU 收集
utilization_gpu
和utilization_memory
等指標,如使用 Amazon CloudWatch 收集 NVIDIA GPU 指標中所示。 -
優化硬體加速器的程式碼、網路運作和設定,以確保系統會充分利用基礎硬體。
-
使用最新的高效能程式庫和 GPU 驅動程式。
-
使用自動化來釋出不使用的 GPU 執行個體。
資源
相關文件:
相關影片:
相關範例: