Especificaciones de imágenes personalizadas de RStudio - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Especificaciones de imágenes personalizadas de RStudio

En esta guía conocerá las especificaciones de imágenes personalizadas de RStudio para utilizarlas con SageMaker cuando incorpore su propia imagen. Hay dos conjuntos de requisitos que debes cumplir con tu imagen de RStudio personalizada para utilizarla con Amazon SageMaker. Estos requisitos los imponen RStudio PBC y la plataforma Amazon SageMaker Studio Classic. Si no se cumple uno de estos conjuntos de requisitos, la imagen personalizada no funcionará correctamente.

Requisitos de RStudio PBC

Los requisitos de RStudio PBC se describen en el artículo Using Docker images with RStudio Workbench / RStudio Server Pro, Launcher, and Kubernetes. Siga las instrucciones de este artículo para crear la base de la imagen personalizada de RStudio.

Para obtener instrucciones sobre cómo instalar varias versiones de R en la imagen personalizada, consulte Instalación de varias versiones de R en Linux.

Requisitos de Amazon SageMaker Studio Classic

Amazon SageMaker Studio Classic impone el siguiente conjunto de requisitos de instalación para la imagen de RStudio.

  • Debe utilizar una imagen base de RStudio como mínimo de 2023.03.2-454.pro2. Para obtener más información, consulte RStudioControl de versiones.

  • Debe instalar los siguientes paquetes:

    yum install -y sudo \ openjdk-11-jdk \ libpng-dev \ && yum clean all \ && /opt/R/${R_VERSION}/bin/R -e "install.packages('reticulate', repos='https://packagemanager.rstudio.com/cran/__linux__/centos7/latest')" \ && /opt/python/${PYTHON_VERSION}/bin/pip install --upgrade \ 'boto3>1.0<2.0' \ 'awscli>1.0<2.0' \ 'sagemaker[local]<3'
  • Debe proporcionar valores predeterminados para los valores de entorno RSTUDIO_CONNECT_URL y RSTUDIO_PACKAGE_MANAGER_URL.

    ENV RSTUDIO_CONNECT_URL "YOUR_CONNECT_URL" ENV RSTUDIO_PACKAGE_MANAGER_URL "YOUR_PACKAGE_MANAGER_URL" ENV RSTUDIO_FORCE_NON_ZERO_EXIT_CODE 1

Las siguientes especificaciones generales se aplican a la imagen representada por una versión de imagen de SageMaker.

Ejecutar la imagen

Las instrucciones de ENTRYPOINT y CMD se anulan para que la imagen se ejecute como una aplicación RSession.

Detener la imagen

La API DeleteApp emite el equivalente de un comando docker stop. Otros procesos del contenedor no recibirán las señales SIGKILL/SIGTERM.

Sistema de archivos

Los directorios /opt/.sagemakerinternal y /opt/ml están reservados. Es posible que los datos de estos directorios no estén visibles en tiempo de ejecución.

Datos de usuario

Cada usuario de un SageMaker dominio recibe un directorio de usuarios en un volumen compartido de Amazon Elastic File System en la imagen. La ubicación del directorio del usuario actual en el volumen de Amazon EFS es /home/sagemaker-user.

Metadatos

Hay un archivo de metadatos en /opt/ml/metadata/resource-metadata.json. No se añaden variables de entorno adicionales a las variables definidas en la imagen. Para obtener más información, consulte Obtener metadatos de aplicaciones.

GPU

En una instancia de GPU, la imagen se ejecuta con la opción --gpus. Solo debe incluirse el kit de herramientas CUDA en la imagen, no en los controladores NVIDIA. Para obtener más información, consulte la Guía del usuario de NVIDIA.

Métricas y registro

Los registros del proceso de RSession se envían a Amazon CloudWatch en la cuenta del cliente. El nombre del grupo de registro es /aws/sagemaker/studio. El nombre del flujo de registro. es $domainID/$userProfileName/RSession/$appName.

Tamaño de imagen

El tamaño de la imagen está limitado a 25 GB. Para ver el tamaño de la imagen, ejecute docker image ls.