Especificações do Dockerfile
A imagem que você especifica no Dockerfile deve atender as especificações nas seções a seguir para criar a imagem com sucesso.
Executando a imagem
-
Entrypoint
: Recomendamos a incorporação do ponto de entrada na imagem seguindo as instruções DockerCMD
ouEntrypoint
. Você também pode configurarContainerEntrypoint
eContainerArguments
que são passados para o contêiner no runtime. -
EnvVariables
: Com o Studio, você pode configurar as variáveisContainerEnvironment
disponibilizadas para um contêiner. A variável de ambiente é substituída pelas variáveis de ambiente do SageMaker. Para proporcionar uma experiência melhor, as variáveis de ambiente geralmente sãoAWS_
eSageMaker_namespaced
para dar prioridade aos ambientes da plataforma.As variáveis de ambiente são da seguinte forma:
-
AWS_REGION
-
AWS_DEFAULT_REGION
-
AWS_CONTAINER_CREDENTIALS_RELATIVE_URI
-
SageMaker_SPACE_NAME
-
Especificações para o usuário e o sistema de arquivos
-
WorkingDirectory
: O volume do Amazon EBS do seu espaço está montado no caminho/home/sagemaker-user
. Não é possível mudar o caminho de montagem. Use a instruçãoWORKDIR
para definir o diretório de trabalho da sua imagem como uma pasta em/home/sagemaker-user
. -
UID
: O ID do usuário do contêiner do Docker. UID=1000 é um valor compatível. É possível adicionar acesso sudo aos seus usuários. As IDs são remapeadas para evitar que um processo em execução no contêiner tenha mais privilégios do que o necessário. -
GID
: O ID do grupo do contêiner do Docker. GID=100 é um valor compatível. É possível adicionar acesso sudo aos seus usuários. As IDs são remapeadas para evitar que um processo em execução no contêiner tenha mais privilégios do que o necessário. -
Diretórios de metadados: os diretórios
/opt/.sagemakerintenral
e/opt/ml
que são usados pela AWS. O arquivo de metadados em/opt/ml
contém metadados sobre recursos comoDomainId
.Use o seguinte comando para mostrar o conteúdo do sistema de arquivos:
cat /opt/ml/metadata/resource-metadata.json {"AppType":"JupyterLab","DomainId":"
example-domain-id
","UserProfileName":"example-user-profile-name
,"ResourceArn":"arn:aws:sagemaker:Região da AWS
:111122223333
;:app/domain-ID
/user-ID
/Jupyte rLab/default","ResourceName":"default","AppImageVersion":"current"} -
Diretórios de registro:
/var/logs/studio
são reservados para os diretórios de registro do JupyterLab e as extensões associadas a ele. Recomendamos que você não use as pastas para criar a imagem.
Verificação de integridade e URL de aplicações
-
Base URL
: O URL base para a aplicação BYOI deve serjupyterlab/default
. Você só pode ter uma aplicação e ele deve sempre ter um nomedefault
. -
HealthCheck API
: OHostAgent
usa oHealthCheckAPI
na porta 8888 para verificar a integridade da aplicação JupyterLab.jupyterlab/default/api/status
é o endpoint para a verificação de integridade. -
Home/Default URL
: Os diretórios/opt/.sagemakerinternal
e/opt/ml
que são usados por AWS. O arquivo de metadados em/opt/ml
contém metadados sobre recursos comoDomainId
. -
Autenticação: Para habilitar a autenticação para seus usuários, desative a autenticação baseada em token ou senha dos cadernos Jupyter e permita todas as origens.
Abaixo é apresentada uma amostra do Dockerfile do Amazon Linux 2 que atende às especificações anteriores:
FROM public.ecr.aws/amazonlinux/amazonlinux:2 ARG NB_USER="sagemaker-user" ARG NB_UID="1000" ARG NB_GID="100" RUN yum install --assumeyes python3 shadow-utils && \ useradd --create-home --shell /bin/bash --gid "${NB_GID}" --uid ${NB_UID} ${NB_USER} && \ yum clean all && \ python3 -m pip install jupyterlab RUN python3 -m pip install --upgrade pip RUN python3 -m pip install --upgrade urllib3==1.26.6 USER ${NB_UID} CMD jupyter lab --ip 0.0.0.0 --port 8888 \ --ServerApp.base_url="/jupyterlab/default" \ --ServerApp.token='' \ --ServerApp.allow_origin='*'
Abaixo é apresentada uma amostra do Dockerfile do Amazon SageMaker Distribution que atende às especificações anteriores:
FROM public.ecr.aws/sagemaker/sagemaker-distribution:latest-cpu ARG NB_USER="sagemaker-user" ARG NB_UID=1000 ARG NB_GID=100 ENV MAMBA_USER=$NB_USER USER root RUN apt-get update RUN micromamba install sagemaker-inference --freeze-installed --yes --channel conda-forge --name base USER $MAMBA_USER ENTRYPOINT ["jupyter-lab"] CMD ["--ServerApp.ip=0.0.0.0", "--ServerApp.port=8888", "--ServerApp.allow_origin=*", "--ServerApp.token=''", "--ServerApp.base_url=/jupyterlab/default"]