Benutzerdefinierte RStudio-Bildspezifikationen - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Benutzerdefinierte RStudio-Bildspezifikationen

In diesem Handbuch lernen Sie benutzerdefinierte RStudio-Bildspezifikationen kennen, die Sie verwenden können, wenn Sie Ihr eigenes Bild mitbringen. Es gibt zwei Sätze von Anforderungen, die Sie mit Ihrem benutzerdefinierten RStudio-Image erfüllen müssen, um es mit Amazon verwenden zu können SageMaker. Diese Anforderungen werden von RStudio PBC und der Amazon SageMaker Studio Classic-Plattform auferlegt. Wenn eine dieser Anforderungen nicht erfüllt ist, funktioniert Ihr benutzerdefiniertes Image nicht ordnungsgemäß.

RStudio PBC-Anforderungen

Die PBC-Anforderungen von RStudio sind im Artikel Verwenden von Docker-Images mit RStudio Workbench/RStudio Server Pro, Launcher und Kubernetes beschrieben. Folgen Sie den Anweisungen in diesem Artikel, um die Basis für Ihr benutzerdefiniertes RStudio-Image zu erstellen.

Anweisungen zur Installation mehrerer R-Versionen in Ihrem benutzerdefinierten Image finden Sie unter Installieren mehrerer Versionen von R unter Linux.

Anforderungen an Amazon SageMaker Studio Classic

Amazon SageMaker Studio Classic legt die folgenden Installationsanforderungen für Ihr RStudio-Image fest.

  • Sie müssen ein RStudio-Basisimage von mindestens 2023.03.2-454.pro2 verwenden. Weitere Informationen finden Sie unter RStudioVersionierung.

  • Installieren Sie die folgenden Pakete:

    yum install -y sudo \ openjdk-11-jdk \ libpng-dev \ && yum clean all \ && /opt/R/${R_VERSION}/bin/R -e "install.packages('reticulate', repos='https://packagemanager.rstudio.com/cran/__linux__/centos7/latest')" \ && /opt/python/${PYTHON_VERSION}/bin/pip install --upgrade \ 'boto3>1.0<2.0' \ 'awscli>1.0<2.0' \ 'sagemaker[local]<3'
  • Sie müssen Standardwerte für die Umgebungswerte RSTUDIO_CONNECT_URL und RSTUDIO_PACKAGE_MANAGER_URL Umgebungswerte angeben.

    ENV RSTUDIO_CONNECT_URL "YOUR_CONNECT_URL" ENV RSTUDIO_PACKAGE_MANAGER_URL "YOUR_PACKAGE_MANAGER_URL" ENV RSTUDIO_FORCE_NON_ZERO_EXIT_CODE 1

Die folgenden allgemeinen Spezifikationen gelten für das Image, das durch eine RStudio-Image-Version dargestellt wird.

Das Bild wird ausgeführt

ENTRYPOINT und CMD Anweisungen werden überschrieben, sodass das Image als RSession-Anwendung ausgeführt wird.

Anhalten des Images

Die DeleteApp-API gibt das Äquivalent zu einem docker stop-Befehl aus. Andere Prozesse im Container erhalten die SIGKILL/SIGTERM-Signale nicht.

Dateisystem

Die Verzeichnisse /opt/.sagemakerinternal und /opt/ml sind reserviert. Alle Daten in diesen Verzeichnissen sind zur Laufzeit möglicherweise nicht sichtbar.

Benutzerdaten

Jeder Benutzer in einer SageMaker Domäne erhält ein Benutzerverzeichnis auf einem freigegebenen Amazon Elastic File System-Volume im Image. Der Speicherort des aktuellen Benutzerverzeichnisses auf dem Amazon Elastic File System-Volume ist /home/sagemaker-user.

Metadaten

Eine Metadatendatei befindet sich unter. /opt/ml/metadata/resource-metadata.json Den im Image definierten Variablen werden keine zusätzlichen Umgebungsvariablen hinzugefügt. Weitere Informationen finden Sie unter Abrufen von App-Metadaten.

GPU

Auf einer GPU-Instance wird das Image mit der --gpus Option ausgeführt. Nur das CUDA-Toolkit sollte im Image enthalten sein, nicht die NVIDIA-Treiber. Weitere Informationen finden Sie im NVIDIA-Benutzerhandbuch.

Metriken und Protokollierung

Protokolle aus dem RSession-Prozess werden CloudWatch im Konto des Kunden an Amazon gesendet. Der Name der Protokollgruppe ist /aws/sagemaker/studio. Der Name des Protokollstream ist $domainID/$userProfileName/RSession/$appName.

Größe des Bildes

Die Bildgröße ist auf 25 GB begrenzt. Führen Sie docker image ls aus, um die Größe Ihres Bilds anzuzeigen.