Especificações do Dockerfile - Amazon SageMaker

Especificações do Dockerfile

A imagem que você especifica no Dockerfile deve atender as especificações nas seções a seguir para criar a imagem com sucesso.

Executando a imagem

  • Entrypoint: Recomendamos a incorporação do ponto de entrada na imagem seguindo as instruções Docker CMD ou Entrypoint. Você também pode configurar ContainerEntrypoint e ContainerArguments que são passados para o contêiner no runtime.

  • EnvVariables: Com o Studio, você pode configurar as variáveis ContainerEnvironment disponibilizadas para um contêiner. A variável de ambiente é substituída pelas variáveis de ambiente do SageMaker. Para proporcionar uma experiência melhor, as variáveis de ambiente geralmente são AWS_ e SageMaker_namespaced para dar prioridade aos ambientes da plataforma.

    As variáveis de ambiente são da seguinte forma:

    • AWS_REGION

    • AWS_DEFAULT_REGION

    • AWS_CONTAINER_CREDENTIALS_RELATIVE_URI

    • SageMaker_SPACE_NAME

Especificações para o usuário e o sistema de arquivos

  • WorkingDirectory: O volume do Amazon EBS do seu espaço está montado no caminho /home/sagemaker-user. Não é possível mudar o caminho de montagem. Use a instrução WORKDIR para definir o diretório de trabalho da sua imagem como uma pasta em /home/sagemaker-user.

  • UID: O ID do usuário do contêiner do Docker. UID=1000 é um valor compatível. É possível adicionar acesso sudo aos seus usuários. As IDs são remapeadas para evitar que um processo em execução no contêiner tenha mais privilégios do que o necessário.

  • GID: O ID do grupo do contêiner do Docker. GID=100 é um valor compatível. É possível adicionar acesso sudo aos seus usuários. As IDs são remapeadas para evitar que um processo em execução no contêiner tenha mais privilégios do que o necessário.

  • Diretórios de metadados: os diretórios /opt/.sagemakerintenral e /opt/ml que são usados pela AWS. O arquivo de metadados em /opt/ml contém metadados sobre recursos como DomainId.

    Use o seguinte comando para mostrar o conteúdo do sistema de arquivos:

    cat /opt/ml/metadata/resource-metadata.json {"AppType":"JupyterLab","DomainId":"example-domain-id","UserProfileName":"example-user-profile-name,"ResourceArn":"arn:aws:sagemaker:Região da AWS:111122223333;:app/domain-ID/user-ID/Jupyte rLab/default","ResourceName":"default","AppImageVersion":"current"}
  • Diretórios de registro: /var/logs/studio são reservados para os diretórios de registro do JupyterLab e as extensões associadas a ele. Recomendamos que você não use as pastas para criar a imagem.

Verificação de integridade e URL de aplicações

  • Base URL: O URL base para a aplicação BYOI deve ser jupyterlab/default. Você só pode ter uma aplicação e ele deve sempre ter um nome default.

  • HealthCheck API: O HostAgent usa o HealthCheckAPI na porta 8888 para verificar a integridade da aplicação JupyterLab. jupyterlab/default/api/status é o endpoint para a verificação de integridade.

  • Home/Default URL: Os diretórios /opt/.sagemakerinternal e /opt/ml que são usados por AWS. O arquivo de metadados em /opt/ml contém metadados sobre recursos como DomainId.

  • Autenticação: Para habilitar a autenticação para seus usuários, desative a autenticação baseada em token ou senha dos cadernos Jupyter e permita todas as origens.

Abaixo é apresentada uma amostra do Dockerfile do Amazon Linux 2 que atende às especificações anteriores:

FROM public.ecr.aws/amazonlinux/amazonlinux:2 ARG NB_USER="sagemaker-user" ARG NB_UID="1000" ARG NB_GID="100" RUN yum install --assumeyes python3 shadow-utils && \ useradd --create-home --shell /bin/bash --gid "${NB_GID}" --uid ${NB_UID} ${NB_USER} && \ yum clean all && \ python3 -m pip install jupyterlab RUN python3 -m pip install --upgrade pip RUN python3 -m pip install --upgrade urllib3==1.26.6 USER ${NB_UID} CMD jupyter lab --ip 0.0.0.0 --port 8888 \ --ServerApp.base_url="/jupyterlab/default" \ --ServerApp.token='' \ --ServerApp.allow_origin='*'

Abaixo é apresentada uma amostra do Dockerfile do Amazon SageMaker Distribution que atende às especificações anteriores:

FROM public.ecr.aws/sagemaker/sagemaker-distribution:latest-cpu ARG NB_USER="sagemaker-user" ARG NB_UID=1000 ARG NB_GID=100 ENV MAMBA_USER=$NB_USER USER root RUN apt-get update RUN micromamba install sagemaker-inference --freeze-installed --yes --channel conda-forge --name base USER $MAMBA_USER ENTRYPOINT ["jupyter-lab"] CMD ["--ServerApp.ip=0.0.0.0", "--ServerApp.port=8888", "--ServerApp.allow_origin=*", "--ServerApp.token=''", "--ServerApp.base_url=/jupyterlab/default"]