Personalizzazione delle immagini Docker per endpoint interattivi - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Personalizzazione delle immagini Docker per endpoint interattivi

È anche possibile personalizzare le immagini Docker per gli endpoint interattivi in modo da poter eseguire immagini kernel di base personalizzate. Questo ti aiuta a garantire le dipendenze necessarie quando esegui carichi di lavoro interattivi da EMR Studio.

  1. Segui le fasi da 1 a 4 descritte in precedenza per personalizzare un'immagine Docker. Per le versioni di Amazon EMR 6.9.0 e successive, puoi ottenere l'immagine di base da URI Amazon ECR Public Gallery. Per le versioni precedenti ad Amazon EMR 6.9.0, puoi ottenere l'immagine negli account Amazon ECR Registry di ciascuno Regione AWS e l'unica differenza è l'immagine di base URI nel tuo Dockerfile. L'immagine URI di base segue il formato:

    ECR-registry-account.dkr.ecr.Region.amazonaws.com/notebook-spark/container-image-tag

    È necessario utilizzare notebook-spark nell'immagine di baseURI, anzichéspark. L'immagine di base contiene il runtime Spark e i kernel del notebook che vengono eseguiti con esso. Per ulteriori informazioni sulla selezione delle Regioni e dei tag di immagine di container, consulta Dettagli per la selezione di un'immagine di base URI.

    Nota

    Attualmente sono supportate solo le sostituzioni delle immagini di base e non è supportata l'introduzione di kernel completamente nuovi di tipo diverso da quello AWS fornito dalle immagini di base.

  2. Crea un endpoint interattivo che si possa utilizzare con l'immagine personalizzata.

    Innanzitutto, create un JSON file chiamato custom-image-managed-endpoint.json con il seguente contenuto.

    { "name": "endpoint-name", "virtualClusterId": "virtual-cluster-id", "type": "JUPYTER_ENTERPRISE_GATEWAY", "releaseLabel": "emr-6.6.0-latest", "executionRoleArn": "execution-role-arn", "certificateArn": "certificate-arn", "configurationOverrides": { "applicationConfiguration": [ { "classification": "jupyter-kernel-overrides", "configurations": [ { "classification": "python3", "properties": { "container-image": "123456789012.dkr.ecr.us-west-2.amazonaws.com/custom-notebook-python:latest" } }, { "classification": "spark-python-kubernetes", "properties": { "container-image": "123456789012.dkr.ecr.us-west-2.amazonaws.com/custom-notebook-spark:latest" } } ] } ] } }

    Quindi, create un endpoint interattivo utilizzando le configurazioni specificate nel JSON file, come illustrato nell'esempio seguente.

    aws emr-containers create-managed-endpoint --cli-input-json custom-image-managed-endpoint.json

    Per ulteriori informazioni, consulta Creazione di un endpoint interattivo per il cluster virtuale.

  3. Connect all'endpoint interattivo tramite EMR Studio. Per ulteriori informazioni, consulta Connessione da Studio.