AWS ParallelCluster AMI 自訂 - AWS ParallelCluster

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

AWS ParallelCluster AMI 自訂

在某些情況下 AWS ParallelCluster ,需要建立 AMI 的自訂。本節涵蓋建置自訂 時要考量的事項 AWS ParallelCluster AMI。

您可以使用下列其中一種方法建置自訂 AWS ParallelCluster AMI:

  1. 建立建置映像組態檔案 ,然後使用 pcluster CLI 使用映像建置器建置EC2映像。此程序為自動化、可重複且支援監控。如需詳細資訊,請參閱pcluster映像命令。

  2. 從 建立執行個體 AWS ParallelCluster AMI,然後登入執行個體並進行手動修改。最後,使用 Amazon AMI 從修改的執行個體EC2建立新的 。此程序花費的時間較少。不過,它不是自動或可重複的,也不支援使用pclusterCLI映像監控命令。

如需這些方法的詳細資訊,請參閱 建置自訂 AWS ParallelCluster AMI

AWS ParallelCluster AMI 自訂考量

無論您如何建立自訂映像,都建議您執行初步驗證測試,並包含監控所建立映像狀態的規定。

若要AMI使用 建置自訂pcluster,您可以使用 EC2 Image Builder 用來建置自訂映像的 和 區段來建立建置映像組態檔案Build ImageBuild 本節指定建立映像所需的 Image Builder。這包括 ParentImage(基礎映像) 和 ComponentsImage Builder 元件會定義在建立映像之前自訂執行個體或測試建立映像啟動的執行個體所需的一系列步驟。如需 AWS ParallelCluster 元件範例,請參閱自訂 AMIsImage 區段指定映像屬性。

從叢集呼叫 build-image 以建立自訂映像時,Image Builder 會使用建置映像組態搭配 AWS ParallelCluster 食譜在您的 AWS ParallelCluster 上開機ParentImage。Image Builder 會下載元件、執行建置和驗證階段、建立 AMI、從 啟動執行個體AMI,以及執行測試。程序完成後,Image Builder 便會產生新的映像或停止訊息。

執行自訂元件驗證測試

在組態中包含 Image Builder 元件之前,請使用下列其中一種方法進行測試和驗證。由於 Image Builder 程序最多可能需要 1 小時,因此建議您事先測試元件。這可以為您節省大量時間。

指令碼案例

在建置映像程序之外,在執行中的執行個體中測試指令碼,並確認指令碼以結束碼 0 結束。

Amazon Resource Name (ARN) 案例

在建置映像程序之外,在執行中的執行個體中測試元件文件。如需需求清單,請參閱 Image Builder 使用者指南中的元件管理員

成功驗證後,將元件新增至建置映像組態

驗證自訂元件是否正常運作後,將其新增至建置映像組態檔案

使用pcluster命令監控 Image Builder 程序以協助偵錯

describe-image

使用此命令來監控建置映像狀態。

list-image-log-streams

使用此命令來取得日誌串流IDs的 ,您可以使用 來擷取日誌事件get-image-log-events

get-image-log-events

使用此命令可取得建置映像程序事件的日誌串流。

例如,您可以使用下列命令來自訂建置映像事件。

$ watch -n 1 'pcluster get-image-log-events -i <image-id> \ --log-stream-name/1 <pcluster-version> \ --query "events[*].message" | tail -n 50'

get-image-stack-events

使用此命令來擷取 Image Builder 建立之堆疊的影像堆疊事件。

export-image-logs

使用此命令儲存映像日誌。

如需 AWS ParallelCluster 日誌和 Amazon 的詳細資訊 CloudWatch,請參閱 Amazon CloudWatch Logs 建置映像日誌Amazon CloudWatch 儀表板

其他考量

新 AWS ParallelCluster 版本和自訂 AMIs

如果您建置並使用自訂 AMI,則必須重複每個AMI新 AWS ParallelCluster 版本用來建立自訂的步驟。

自訂引導動作

檢閱 自訂引導動作章節,判斷您欲進行的修改是否可以使用未來 AWS ParallelCluster 版本的指令碼和支援。

使用自訂 AMIs

您可以在 / Image CustomAmiScheduling / SlurmQueues / - Name / Image / CustomAmi區段AMIs的叢集組態中指定自訂。

若要對自訂AMI驗證警告進行疑難排解,請參閱 對自訂AMI問題進行疑難排解