具有互動端點的自訂核心映像 - Amazon EMR

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

具有互動端點的自訂核心映像

若要確保您在從 Amazon EMR Studio 執行互動式工作負載時擁有應用程式正確的相依性,您可以自訂互動式端點的 Docker 映像,並執行自訂的基礎核心映像。若要建立互動端點,並將其與自訂 Docker 映像檔相連,請執行以下步驟。

注意

只能覆寫基礎映像。無法新增核心映像類型。

  1. 建立並發布自訂的 Docker 映像檔。基礎映像包含 Spark 執行期和隨之一起執行的筆記本核心。若要建立映像,可遵循 如何自訂 Docker 映像檔 中的步驟 1 到 4。在步驟 1 URI中,Docker 檔案中的基本映像必須使用 notebook-spark 取代 spark

    ECR-registry-account.dkr.ecr.Region.amazonaws.com/notebook-spark/container-image-tag

    如需如何選取 AWS 區域 和容器映像標籤的詳細資訊,請參閱 選取基礎映像的詳細資訊 URI

  2. 建立可與自訂映像搭配使用的互動端點。

    1. 建立custom-image-managed-endpoint.json具有下列內容JSON的檔案。此範例使用 Amazon 6.9.0 EMR版。

      { "name": "endpoint-name", "virtualClusterId": "virtual-cluster-id", "type": "JUPYTER_ENTERPRISE_GATEWAY", "releaseLabel": "emr-6.9.0-latest", "executionRoleArn": "execution-role-arn", "configurationOverrides": { "applicationConfiguration": [ { "classification": "jupyter-kernel-overrides", "configurations": [ { "classification": "python3", "properties": { "container-image": "123456789012.dkr.ecr.us-west-2.amazonaws.com/custom-notebook-python:latest" } }, { "classification": "spark-python-kubernetes", "properties": { "container-image": "123456789012.dkr.ecr.us-west-2.amazonaws.com/custom-notebook-spark:latest" } } ] } ] } }
    2. 使用JSON檔案中指定的組態建立互動式端點,如下列範例所示。如需詳細資訊,請參閱使用 create-managed-endpoint 命令建立互動端點

      aws emr-containers create-managed-endpoint --cli-input-json custom-image-managed-endpoint.json
  3. 透過 EMR Studio 連線至互動式端點。如需詳細資訊和要完成的步驟,請參閱 AWS Workshop Studio 文件中的從 Amazon 中的 Studio 連線EKS一節。 EMR