AWS ParallelCluster AMI 自訂 - AWS ParallelCluster

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

AWS ParallelCluster AMI 自訂

在某些情況下 AWS ParallelCluster ,需要為 建置自訂 AMI。本節涵蓋建置自訂 AWS ParallelCluster AMI 時要考量的事項。

您可以使用下列其中一種方法來建置自訂 AWS ParallelCluster AMI:

  1. 建立建置映像組態檔案,然後使用 pcluster CLI 使用 EC2 Image Builder 建置映像。此程序是自動化、可重複的,並支援監控。如需詳細資訊,請參閱pcluster映像命令。

  2. 從 AWS ParallelCluster AMI 建立執行個體,然後登入執行個體並進行手動修改。最後,使用 Amazon EC2 從修改的執行個體建立新的 AMI。此程序花費的時間較少。不過,它不是自動化或可重複的,也不支援使用 CLI pcluster 映像監控命令。

如需這些方法的詳細資訊,請參閱建置自訂 AWS ParallelCluster AMI

AWS ParallelCluster AMI 自訂考量

無論您如何建立自訂映像,我們建議您執行初步驗證測試,並包含監控所建立映像狀態的 條款。

若要使用 建置自訂 AMIpcluster,您可以使用 EC2 Image Builder 用來建置自訂映像的 和 區段來建立建置映像組態檔案Build ImageBuild 本節指定建置映像所需的映像建置器。這包括 ParentImage(基礎映像) 和 Components。Image Builder 元件會定義一系列步驟,這些步驟是在建立映像之前自訂執行個體,或測試建立之映像啟動的執行個體。如需 AWS ParallelCluster 元件範例,請參閱自訂 AMIsImage 區段指定映像屬性。

從叢集呼叫 build-image 以建立自訂映像時,Image Builder 會使用建置映像組態搭配 AWS ParallelCluster 技術指南,在您的 AWS ParallelCluster 上引導ParentImage。Image Builder 會下載元件、執行建置和驗證階段、建立 AMI、從 AMI 啟動執行個體,以及執行測試。程序完成時,Image Builder 會產生新的映像或停止訊息。

執行自訂元件驗證測試

在組態中包含 Image Builder 元件之前,請使用下列其中一種方法進行測試和驗證。由於 Image Builder 程序最多可能需要 1 小時,我們建議您事先測試元件。這可以為您節省大量時間。

指令碼案例

在建置映像程序外的執行中執行個體中測試指令碼,並確認指令碼以結束碼 0 結束。

Amazon Resource Name (ARN) 案例

在建置映像程序之外,在執行中的執行個體中測試元件文件。如需需求清單,請參閱 映像建置器使用者指南中的元件管理員

成功驗證後,將 元件新增至建置映像組態

驗證自訂元件是否正常運作後,將其新增至建置映像組態檔案

使用 pcluster 命令監控 Image Builder 程序,以協助偵錯

describe-image

使用此命令來監控建置映像狀態。

list-image-log-streams

使用此命令來取得日誌串流IDs,您可以使用 來擷取日誌事件get-image-log-events

get-image-log-events

使用此命令可取得建置映像程序事件的日誌串流。

例如,您可以使用下列命令來結束建置映像事件。

$ watch -n 1 'pcluster get-image-log-events -i <image-id> \ --log-stream-name/1 <pcluster-version> \ --query "events[*].message" | tail -n 50'

get-image-stack-events

使用此命令來擷取 Image Builder 建立之堆疊的影像堆疊事件。

export-image-logs

使用此命令儲存映像日誌。

如需 AWS ParallelCluster 日誌和 Amazon CloudWatch 的詳細資訊,請參閱 Amazon CloudWatch Logs 建置映像日誌Amazon CloudWatch 儀表板

其他考量

新 AWS ParallelCluster 版本和自訂 AMIs

如果您建置並使用自訂 AMI,則必須在每個新 AWS ParallelCluster 版本中重複用來建立自訂 AMI 的步驟。

自訂引導動作

檢閱 自訂引導動作區段,判斷您欲進行的修改是否可以使用指令碼撰寫,並支援未來的 AWS ParallelCluster 版本。

使用自訂 AMIs

您可以在 / CustomAmiImage / Scheduling / SlurmQueues - Name/ Image / CustomAmi區段的叢集組態中指定自訂 AMIs。

若要對自訂 AMI 驗證警告進行故障診斷,請參閱 對自訂 AMI 問題進行故障診斷