Administración del entorno - Amazon SageMaker

Administración del entorno

Amazon SageMaker Studio Lab proporciona entornos preinstalados para las instancias de cuaderno de Studio Lab. Los entornos permiten iniciar una instancia de cuaderno de Studio Lab con los paquetes que desee utilizar. Para ello, hay que instalar los paquetes en el entorno y, a continuación, seleccionar el entorno como kernel.

Studio Lab pone a su disposición varios entornos preinstalados. Por lo general, es conveniente utilizar el entorno sagemaker-distribution si quiere utilizar un entorno totalmente administrado que ya contenga muchos paquetes populares que los ingenieros de machine learning (ML) y los científicos de datos utilizan. En otro caso, puede utilizar el entorno default si desea realizar una personalización persistente de su entorno. Para obtener más información sobre los entornos de Studio Lab preinstalados disponibles, consulte Entornos preinstalados de Studio Lab.

Puede agregar nuevos paquetes (o bibliotecas) para personalizar su entorno. También puede crear nuevos entornos desde Studio Lab, importar entornos compatibles o restablecer su entorno para crear espacio, entre otras acciones.

Los siguientes comandos son para ejecutarlos en un terminal de Studio Lab. Sin embargo, al instalar los paquetes, se recomienda encarecidamente instalarlos en el cuaderno de Jupyter de Studio Lab. De este modo se segura de que los paquetes se instalen en el entorno previsto. Para ejecutar los comandos en un cuaderno de Jupyter, anteponga el signo % al comando antes de ejecutar la celda. Por ejemplo, el fragmento de código pip list de un terminal equivale a %pip list en un cuaderno de Jupyter.

En las siguientes secciones se proporciona información sobre su entorno de conda default, cómo personalizarlo y cómo agregar y eliminar entornos de conda. Para obtener una lista de ejemplos de entornos que puede instalar en Studio Lab, consulte Creating Custom conda Environments. Para usar estos ejemplos de archivos de YAML del entorno con Studio Lab, consulte Paso 4: instalación de los entornos de conda de Studio Lab en Studio Classic.

Entorno predeterminado

Studio Lab utiliza entornos de conda para encapsular los paquetes de software que se necesitan para ejecutar los cuadernos. Su proyecto contiene un entorno de conda predeterminado, denominado default, con el kernel de IPython. Este entorno sirve como kernel predeterminado para sus cuadernos de Jupyter.

Visualización de entornos

Para ver los entornos de Studio Lab, puede utilizar un terminal o un cuaderno de Jupyter. El siguiente comando es para un terminal de Studio Lab. Si desea ejecutar los comandos correspondientes en un cuaderno de Jupyter, consulte Administración del entorno.

Abra el terminal de Studio Lab. Para ello, abra el panel del Explorador de archivos ( Black square icon representing a placeholder or empty image. ), seleccione el signo más (+) en el menú de la parte superior del explorador de archivos para abrir Lanzador y, a continuación, seleccione Terminal. Desde el terminal de Studio Lab, ejecute lo siguiente para enumerar los entornos de conda.

conda env list

Con este comando se genera una lista de los entornos de conda y sus ubicaciones en el sistema de archivos. Cuando se realiza la incorporación a Studio Lab, se activa automáticamente el entorno de conda de studiolab. El siguiente es un ejemplo de los entornos de la lista después de la incorporación.

# conda environments: # default /home/studio-lab-user/.conda/envs/default studiolab * /home/studio-lab-user/.conda/envs/studiolab studiolab-safemode /opt/amazon/sagemaker/safemode-home/.conda/envs/studiolab-safemode base /opt/conda sagemaker-distribution /opt/conda/envs/sagemaker-distribution

El signo * indica el entorno activado.

Creación, activación y uso de nuevos entornos de conda

Si desea mantener varios entornos para diferentes casos de uso, puede crear nuevos entornos de conda en su proyecto. En las secciones siguientes se muestra cómo crear y activar nuevos entornos de conda. Para ver un cuaderno de Jupyter en el que se muestre cómo crear un entorno personalizado, consulte Setting up a Custom Environment in SageMaker Studio Lab.

nota

El mantenimiento de varios entornos se tiene en cuenta al calcular la memoria disponible en Studio Lab.

Creación de un entorno de conda

Para crear un entorno de conda, ejecute el siguiente comando de conda desde su terminal. En este ejemplo se crea un entorno nuevo con Python 3.9.

conda create --name <ENVIRONMENT_NAME> python=3.9

Una vez creado el entorno de conda, se puede ver el entorno en la lista de entornos. Para obtener más información sobre cómo ver la lista de entornos, consulte Visualización de entornos.

Activación de un entorno de conda

Para activar cualquier entorno de conda, ejecute el siguiente comando en el terminal.

conda activate <ENVIRONMENT_NAME>

Al ejecutar este comando, todos los paquetes instalados mediante conda o pip se instalan en el entorno. Para obtener más información sobre la instalación de paquetes, consulte Personalización de un entorno.

Uso de un entorno de conda

Para usar sus nuevos entornos de conda con cuadernos, asegúrese de que el paquete ipykernel esté instalado en el entorno.

conda install ipykernel

Una vez que el paquete ipykernel esté instalado en el entorno, puede seleccionar el entorno como kernel del cuaderno.

Puede que tenga que reiniciar JupyterLab para ver el entorno disponible como kernel. Para ello, elija Amazon SageMaker Studio Lab en el menú superior de Studio Lab y seleccione Reiniciar JupyterLab....

Al crear un cuaderno nuevo desde el lanzador de Studio Lab, se ofrece la opción de elegir el kernel en Cuaderno. Para obtener información general sobre la interfaz de usuario de Studio Lab, consulte Información general de la interfaz de usuario de Amazon SageMaker Studio Lab.

Cuando un cuaderno de Jupyter está abierto, puede elegir el kernel. Para ello, seleccione Kernel en el menú superior y elija Cambiar kernel...

Uso de ejemplos de entornos de Studio Lab

Studio Lab proporciona ejemplos de entornos personalizados a través del repositorio SageMaker Studio Lab Examples. En el siguiente ejemplo se muestra cómo clonar y crear estos entornos.

  1. Clone el repositorio de GitHub de SageMaker Studio Lab Examples siguiendo las instrucciones de Uso de recursos de GitHub.

  2. En Studio Lab, seleccione el icono del Explorador de archivos ( Black square icon representing a placeholder or empty image. ) en el menú de la izquierda para que el panel Explorador de archivos aparezca a la izquierda.

  3. Vaya al directorio studio-lab-examples/custom-environments del explorador de archivos.

  4. Abra el directorio del entorno que desea crear.

  5. Haga clic con el botón derecho en el archivo .yml de la carpeta y, a continuación, seleccione Crear entorno de conda.

  6. Ahora puede usar el entorno como kernel una vez que su entorno de conda haya terminado de crearse. Para obtener instrucciones sobre cómo utilizar un entorno existente como kernel, consulte Creación, activación y uso de nuevos entornos de conda.

Personalización de un entorno

Para personalizar su entorno, puede instalar y quitar extensiones y paquetes según sea necesario. Studio Lab incluye entornos con paquetes preinstalados. El uso de un entorno existente puede ahorrarle tiempo y memoria, ya que los paquetes preinstalados no se tienen en cuenta al calcular la memoria disponible de Studio Lab. Para obtener más información sobre los entornos de Studio Lab preinstalados disponibles, consulte Entornos preinstalados de Studio Lab.

Todas las extensiones y los paquetes instalados en su entorno default persistirán en el proyecto. Es decir, no es preciso instalar los paquetes en cada sesión de tiempo de ejecución del proyecto. Sin embargo, las extensiones y los paquetes instalados en su entorno sagemaker-distribution no persistirán, por lo que tendrá que instalar nuevos paquetes en la próxima sesión. Por lo tanto, se recomienda encarecidamente instalar los paquetes en el cuaderno a fin de asegurarse de que se instalen en el entorno previsto.

Para ver los entornos, ejecute el comando conda env list.

Para activar el entorno, ejecute el comando conda activate <ENVIRONMENT_NAME>.

Para ver los paquetes de un entorno, ejecute el comando conda list.

Instalación de paquetes

Se recomienda encarecidamente instalar los paquetes en su cuaderno de Jupyter para asegurarse de que se instalan en el entorno previsto. Para instalar paquetes adicionales en su entorno desde un cuaderno de Jupyter, ejecute uno de los siguientes comandos en una celda de su cuaderno de Jupyter. Con estos comandos se instalan los paquetes en el entorno activado en ese momento.

  • %conda install <PACKAGE>

  • %pip install <PACKAGE>

No recomendamos usar los comandos !pip o !conda, ya que pueden comportarse de forma inesperada cuando hay varios entornos.

Tras instalar los paquetes nuevos en su entorno, es posible que tenga que reiniciar el kernel para asegurarse de que los paquetes funcionan en su cuaderno. Para ello, elija Amazon SageMaker Studio Lab en el menú superior de Studio Lab y seleccione Reiniciar JupyterLab....

Eliminación de paquetes

Para eliminar un paquete, ejecute el comando

%conda remove <PACKAGE_NAME>

Con este comando también se eliminará cualquier paquete que dependa de <PACKAGE_NAME>, salvo que se pueda encontrar un reemplazo sin esa dependencia.

Para ver todos los paquetes de un entorno, ejecute el comando

conda deactivate && conda env remove --name <ENVIRONMENT_NAME>

Actualización de Studio Lab

Para actualizar Studio Lab, elimine todos los entornos y archivos.

  1. Enumere todos los entornos de conda.

    conda env list
  2. Active el entorno base.

    conda activate base
  3. Elimine todos los entornos de la lista de entornos de conda, además del entorno base.

    conda remove --name <ENVIRONMENT_NAME> --all
  4. Elimine todos los archivos de su Studio Lab.

    rm -rf *.*