教學課程:建立運算資源 AMI - AWS Batch

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

教學課程:建立運算資源 AMI

您可以建立自己的自訂運算資源AMI,以用於受管和未受管的運算環境。如需說明,請參閱 運算資源AMI規格。然後,在建立自訂 之後AMI,您可以建立運算環境,使用AMI它來建立任務佇列的關聯。最後,開始將任務提交至該佇列。

建立自訂運算資源 AMI
  1. 選擇要從中開始AMI的基礎。基礎AMI必須使用HVM虛擬化。基底AMI不能是 Windows AMI。

    注意

    AMI 您為運算環境選擇的 必須符合您要用於該運算環境的執行個體類型的架構。例如,如果您的運算環境使用 A1 執行個體類型,AMI您選擇的運算資源必須支援 Arm 執行個體。Amazon ECS vends 兩者 x86 以及 Arm Amazon ECS最佳化 Amazon Linux 2 的版本AMI。如需詳細資訊,請參閱 Amazon Elastic Container Service 開發人員指南 中的 Amazon ECS最佳化 Amazon Linux 2AMI

    Amazon ECS最佳化 Amazon Linux 2 AMI是受管運算環境中運算資源AMI的預設值。Amazon ECS最佳化的 Amazon Linux 2 AWS Batch 由 AWS 工程師AMI預先設定並在 上進行測試。您最少AMI可以開始使用 ,並 AWS 快速取得正在執行的運算資源。如需詳細資訊,請參閱 Amazon Elastic Container Service 開發人員指南 中的 Amazon ECS OptimizedAMI

    或者,您可以選擇其他 Amazon Linux 2 變體,並使用下列命令安裝ecs-init套件。如需詳細資訊,請參閱Amazon Elastic ECS Container Service 開發人員指南中的在 Amazon Linux 2 EC2執行個體上安裝 Amazon 容器代理程式:

    $ sudo amazon-linux-extras disable docker $ sudo amazon-linux-extras install ecs-init

    例如,如果您想要在 AWS Batch 運算資源上執行GPU工作負載,您可以從 Amazon Linux 深度學習 AMI開始。然後,AMI將 設定為執行 AWS Batch 任務。如需詳細資訊,請參閱使用GPU工作負載 AMI

    重要

    您可以選擇AMI不支援ecs-init套件的 基底。不過,如果您這樣做,則必須設定在開機時啟動 Amazon ECS代理程式並保持執行的方式。您也可以檢視數個用於systemd啟動和監控 Amazon ECS容器代理程式的使用者資料組態指令碼範例。如需詳細資訊,請參閱 Amazon Elastic Container Service 開發人員指南 中的容器執行個體使用者資料組態指令碼範例

  2. AMI 使用適用於您 的適當儲存選項,從您選取的 基礎啟動執行個體AMI。如果您選取的執行個體類型支援 Amazon EBS磁碟區或執行個體儲存磁碟區,您可以設定其大小和數量。如需詳細資訊,請參閱 Amazon 使用者指南 中的啟動執行個體和 Amazon Instance Store。 EC2 EC2

  3. 使用 連線至您的執行個體 SSH 並執行任何必要的組態任務。這可能包括下列任何或所有步驟:

    • 安裝 Amazon ECS容器代理程式。如需詳細資訊,請參閱Amazon Elastic ECS Container Service 開發人員指南中的安裝 Amazon Container Agent。

    • 設定指令碼,以設置執行個體存放區磁碟區的格式。

    • 將執行個體存放區磁碟區或 Amazon EFS 檔案系統新增至 /etc/fstab 檔案,以便在開機時掛載。

    • 設定 Docker 選項,例如啟用偵錯或調整基本映像大小。

    • 安裝套件或複製檔案。

    如需詳細資訊,請參閱 Amazon EC2 使用者指南 中的使用 連線至 Linux 執行個體SSH

  4. 如果您在執行個體上啟動 Amazon ECS容器代理程式,則必須停止它,並在建立 之前移除任何持久性資料檢查點檔案AMI。否則,如果您不執行此操作,代理程式不會啟動從 啟動的執行個體AMI。

    1. 停止 Amazon ECS容器代理程式。

      • Amazon ECS最佳化 Amazon Linux 2AMI:

        sudo systemctl stop ecs
      • Amazon ECS最佳化 Amazon LinuxAMI:

        sudo stop ecs
    2. 移除持久性資料檢查點檔案。根據預設,這些檔案位於 /var/lib/ecs/data/目錄中。如有任何檔案,請使用下列命令來移除這些檔案。

      sudo rm -rf /var/lib/ecs/data/*
  5. AMI 從執行中的執行個體建立新的 。如需詳細資訊,請參閱 Amazon 使用者指南中的建立 Amazon EBS Backed LinuxAMI EC2

若要將新 AMI 與 搭配使用 AWS Batch
  1. 建立新的 AMI 之後,請使用新的 建立運算環境AMI。若要這麼做,請在建立 AWS Batch 運算環境時,選擇影像類型,然後在影像 AMI ID 覆寫方塊中輸入自訂 ID。 如需詳細資訊,請參閱教學課程:使用 Amazon EC2 資源建立受管運算環境

    注意

    AMI 您為運算環境選擇的 必須符合您要用於該運算環境的執行個體類型的架構。例如,如果您的運算環境使用 A1 執行個體類型,AMI您選擇的運算資源必須支援 Arm 執行個體。Amazon ECS vends 兩者 x86 以及 Arm Amazon ECS最佳化 Amazon Linux 2 的版本AMI。如需詳細資訊,請參閱 Amazon Elastic Container Service 開發人員指南 中的 Amazon ECS最佳化 Amazon Linux 2AMI

  2. 建立任務佇列,並與新的運算環境建立關聯。如需詳細資訊,請參閱建立任務佇列

    注意

    與任務佇列相關聯的所有運算環境必須共用相同的架構。 AWS Batch 不支援在單一任務佇列中混合運算環境架構類型。

  3. (選用) 將範例任務提交到新的任務佇列。如需詳細資訊,請參閱參考:任務定義範例建立單節點任務定義 教學課程:提交任務