Restricciones y consideraciones - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Restricciones y consideraciones

Revise las siguientes restricciones para asegurarse de que los trabajos de su cuaderno se completen correctamente. Studio usa Papermill para ejecutar cuadernos. Puede que tengas que actualizar los cuadernos de Jupyter para adaptarlos a los requisitos de Papermill. También hay restricciones en cuanto al contenido de los LCC scripts y detalles importantes que hay que entender en relación con la configuración. VPC

JupyterLab versión

JupyterLab Se admiten las versiones 3.0 y superiores.

Instalación de paquetes que requieren reiniciar el kernel

Papermill no admite llamadas pip install para instalar paquetes que requieran reiniciar el kernel. En este caso, use pip install en un script de inicialización. Si la instalación de un paquete no requiere reiniciar el kernel, también puede incluir pip install en el cuaderno.

Nombres de kernels y lenguajes registrados en Jupyter

Papermill registra un traductor para kernels y lenguajes específicos. Si utilizas tu propia instancia (BYOI), usa un nombre de núcleo estándar, como se muestra en el siguiente fragmento:

papermill_translators.register("python", PythonTranslator) papermill_translators.register("R", RTranslator) papermill_translators.register("scala", ScalaTranslator) papermill_translators.register("julia", JuliaTranslator) papermill_translators.register("matlab", MatlabTranslator) papermill_translators.register(".net-csharp", CSharpTranslator) papermill_translators.register(".net-fsharp", FSharpTranslator) papermill_translators.register(".net-powershell", PowershellTranslator) papermill_translators.register("pysparkkernel", PythonTranslator) papermill_translators.register("sparkkernel", ScalaTranslator) papermill_translators.register("sparkrkernel", RTranslator) papermill_translators.register("bash", BashTranslator)

Límites de parámetros y variables de entorno

Límites de parámetros y variables de entorno. Al crear el trabajo del cuaderno, este recibe los parámetros y las variables de entorno que especifique. Puede agregar hasta 100 parámetros. El nombre de cada parámetro puede tener una longitud máxima de 256 caracteres y el valor asociado puede tener una longitud máxima de 2500 caracteres. Si agrega variables de entorno, puede agregar hasta 28 variables. El nombre de la variable y el valor asociado pueden tener hasta 512 caracteres. Si necesita más de 28 variables de entorno, utilice variables de entorno adicionales en un script de inicialización que no limite el número de variables de entorno que puede utilizar.

Visualización de trabajos y definiciones de trabajos

Visualización de trabajos y definiciones de trabajos. Si programa su trabajo de bloc de notas en la interfaz de usuario de Studio del JupyterLab bloc de notas, puede ver los trabajos de su bloc de notas y sus definiciones de trabajo de bloc de notas en la interfaz de usuario de Studio. Si programó el trabajo de su cuaderno con SageMaker PythonSDK, solo podrá ver sus trabajos; el paso del trabajo del SDK cuaderno de SageMaker Python no crea definiciones de trabajo. Para ver los trabajos, también debe añadir etiquetas adicionales a la instancia de pasos de trabajo de su cuaderno. Para obtener más información, consulte Consulta los trabajos de tu bloc de notas en el panel de la interfaz de usuario de Studio.

Imagen

Debe gestionar las restricciones de imagen en función de si ejecuta los trabajos del cuaderno en Studio o el paso del trabajo del SDK cuaderno de SageMaker Python en un proceso.

Restricciones de imagen para los trabajos de SageMaker Notebook (Studio)

Compatibilidad de imágenes y kernels. El controlador que inicia el trabajo del cuaderno presupone lo siguiente:

  • Se instala un entorno de ejecución básico de Python en las imágenes de Studio o bring-your-own (BYO) y es el predeterminado en el shell.

  • El entorno de tiempo de ejecución básico de Python incluye el cliente Jupyter con las especificaciones del kernel correctamente configuradas.

  • El entorno de tiempo de ejecución básico de Python incluye la función pip para que el trabajo del cuaderno pueda instalar las dependencias del sistema.

  • En el caso de imágenes con varios entornos, el script de inicialización debe cambiar al entorno específico del kernel adecuado antes de instalar los paquetes específicos del cuaderno. Debe volver al entorno de tiempo de ejecución de Python predeterminado, si es diferente del entorno de tiempo de ejecución del kernel, después de configurar el entorno de tiempo de ejecución de Python del kernel.

El controlador que inicia el trabajo de su cuaderno es un script bash, y Bash v4 debe estar disponible en /bin/bash.

Privilegios de root en bring-your-own-images (BYOI). Debe tener privilegios raíz en sus propias imágenes de Studio, ya sea como usuario raíz o mediante acceso sudo. Si no es un usuario raíz pero accede a los privilegios raíz a través de sudo, use 1000/100 como UID/GID.

Restricciones de imagen para trabajos de SDK cuadernos de SageMaker Python

El paso de trabajo del cuaderno admite las siguientes imágenes:

  • SageMaker Las imágenes de distribución aparecen en SageMaker Imágenes de Amazon disponibles para su uso con Studio Classic.

  • Imagen personalizada basada en las imágenes SageMaker de distribución de la lista anterior. Utilice una imagen de SageMaker distribución como base.

  • Una imagen personalizada (BYOI) preinstalada con las dependencias de los trabajos del portátil (es decir, sagemaker-headless-execution-driver La imagen debe cumplir los siguientes requisitos:

    • La imagen viene preinstalada con las dependencias de trabajo del portátil.

    • Se instala un entorno de ejecución base de Python, que se encuentra por defecto en el entorno de shell.

    • El entorno de tiempo de ejecución básico de Python incluye el cliente Jupyter con las especificaciones del kernel correctamente configuradas.

    • Tiene privilegios de root, ya sea como usuario root o mediante el sudo acceso. Si no es un usuario raíz pero accede a los privilegios raíz a través de sudo, use 1000/100 como UID/GID.

VPCsubredes utilizadas durante la creación de trabajos

Si utilizas unaVPC, Studio utilizará tus subredes privadas para crear tu trabajo. Especifique de una a cinco subredes privadas (y de 1 a 15 grupos de seguridad).

Si utilizas una VPC con subredes privadas, debes elegir una de las siguientes opciones para garantizar que la tarea del portátil se pueda conectar a los servicios o recursos dependientes:

  • Si el trabajo necesita acceder a un AWS servicio que admita VPC puntos de conexión de interfaz, cree un punto final para conectarse al servicio. Para obtener una lista de los servicios que admiten los puntos finales de la interfaz, consulte AWS los servicios que se integran con. AWS PrivateLink Para obtener información sobre la creación de un VPC punto final de interfaz, consulte Acceder a un AWS servicio mediante un VPC punto final de interfaz. Como mínimo, se debe proporcionar una puerta de enlace de VPC punto final Amazon S3.

  • Si un trabajo portátil necesita acceder a un AWS servicio que no admite VPC puntos de enlace de interfaz o a un recurso externo AWS, cree una NAT puerta de enlace y configure sus grupos de seguridad para permitir las conexiones salientes. Para obtener información sobre cómo configurar una NAT puerta de enlace para ustedVPC, consulte VPCCon subredes públicas y privadas (NAT) en la Guía del usuario de Amazon Virtual Private Cloud.

Límites de los servicios

Dado que el programador de trabajos de notebook se ha creado a partir de los EventBridge servicios de Pipelines, SageMaker Training y Amazon, los trabajos de tu notebook están sujetos a sus cuotas específicas de servicio. Si supera estas cuotas, es posible que vea mensajes de error relacionados con estos servicios. Por ejemplo, hay límites en cuanto al número de canalizaciones que se pueden ejecutar a la vez y al número de reglas que se pueden configurar para un único bus de eventos. Para obtener más información sobre SageMaker las cuotas, consulte Amazon SageMaker Endpoints and Quotas. Para obtener más información sobre EventBridge las cuotas, consulta Amazon EventBridge Quotas.