Opciones disponibles - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Opciones disponibles

La siguiente tabla muestra todas las opciones disponibles que puede usar para personalizar su trabajo de notebook, ya sea que ejecute su trabajo de notebook en Studio, en un entorno Jupyter local o usando Python SageMaker . SDK La tabla incluye el tipo de opción personalizada, una descripción, directrices adicionales sobre cómo utilizarla, un nombre de campo para la opción en Studio (si está disponible) y el nombre del parámetro para el paso del trabajo del cuaderno en SageMaker Python SDK (si está disponible).

En el caso de algunas opciones, también puede preconfigurar valores predeterminados personalizados para no tener que especificarlos cada vez que configure un trabajo de cuaderno. En el caso de Studio, estas opciones son Función, Carpeta de entrada, Carpeta de salida e ID de KMS clave, y se especifican en la siguiente tabla. Si ha preconfigurado valores predeterminados personalizados para estas opciones, estos campos se rellenan automáticamente en el formulario Crear trabajo al crear el trabajo de cuaderno. Para obtener más información sobre cómo crear valores predeterminados personalizados en los entornos de Studio y Jupyter locales, consulte Configuración de opciones predeterminadas para los cuadernos locales.

La SageMaker IA SDK también te da la opción de establecer valores predeterminados inteligentes para que no tengas que especificar estos parámetros al crear unNotebookJobStep. Estos parámetros son role, s3_root_uri, s3_kms_key, volume_kms_key, subnets y security_group_ids, y se especifican en la siguiente tabla. Para obtener más información acerca de cómo configurar valores predeterminados inteligentes, consulteConfiguración de opciones predeterminadas.

Opción personalizada Descripción Directriz específica de Studio Directriz de entorno local de Jupyter SageMaker SDKGuía de Python
Nombre del trabajo El nombre de su trabajo tal y como debería aparecer en el panel Trabajos de cuaderno. Campo Nombre del trabajo. Igual que Studio. Parámetro notebook_job_name. El valor predeterminado es None.
Imagen La imagen del contenedor utilizada para ejecutar el cuaderno de forma no interactiva en el tipo de cómputo elegido. Campo Imagen. Este campo tiene como valor predeterminado la imagen actual del cuaderno. Cambie este campo del valor predeterminado a uno personalizado si es necesario. Si Studio no puede inferir este valor, el formulario muestra un error de validación que requiere que lo especifique. Esta imagen puede ser personalizada, una bring-your-own imagen o una imagen disponible de Amazon SageMaker AI. Para obtener una lista de las imágenes de SageMaker IA disponibles compatibles con el programador de cuadernos, consulteImágenes de Amazon SageMaker AI disponibles para su uso con Studio Classic. Campo Imagen. Este campo requiere una imagen ECR URI de Docker que pueda ejecutar el cuaderno suministrado en el tipo de cómputo seleccionado. De forma predeterminada, la extensión del planificador usa Python 2.0 precompilado y basado en imágenes de Docker de SageMaker IA. Esta es la imagen oficial de Python 3.8 DockerHub con boto3 y el AWS CLI núcleo de Python 3. También puede proporcionar cualquier imagen ECR URI que cumpla con la especificación de imagen personalizada del cuaderno. Para obtener más información, consulte Especificaciones de imagen de SageMaker IA personalizadas. Esta imagen debe contener todos los kernels y bibliotecas necesarios para el funcionamiento del cuaderno. Obligatorio. Parámetroimage_uri. URIubicación de una imagen de Docker enECR. Puede utilizar imágenes de SageMaker distribución específicas o una imagen personalizada basada en esas imágenes, o bien puede utilizar su propia imagen preinstalada con las dependencias de trabajo del portátil para cumplir con los requisitos adicionales. Para obtener más información, consulte Restricciones de imagen para trabajos de SDK cuadernos Python con SageMaker IA.
Tipo de instancia El tipo de EC2 instancia que se utilizará para ejecutar el trabajo del cuaderno. El trabajo del cuaderno utiliza un trabajo de SageMaker formación como capa de cálculo, por lo que el tipo de instancia especificado debe ser un tipo de instancia compatible con SageMaker formación. Campo Tipo de computación. El valor predeterminado es ml.m5.large. Igual que Studio. Parámetro instance_type. El valor predeterminado es ml.m5.large.
Kernel El kernel de Jupyter utilizado para ejecutar el trabajo del cuaderno. Campo Kernel. Este campo tiene como valor predeterminado el kernel actual del cuaderno. Cambie este campo del valor predeterminado a uno personalizado si es necesario. Si Studio no puede inferir este valor, el formulario muestra un error de validación que requiere que lo especifique. Campo Kernel. Este kernel debe estar presente en la imagen y seguir las especificaciones del kernel de Jupyter. Este campo tiene como valor predeterminado el núcleo de Python3 que se encuentra en la imagen base de IA de Python 2.0. SageMaker Cambie este campo a un valor personalizado si es necesario. Obligatorio. Parámetro kernel_name. Este kernel debe estar presente en la imagen y seguir las especificaciones del kernel de Jupyter. Para ver los identificadores del núcleo de su imagen, consulte (). LINK
SageMaker Sesión de IA La sesión de SageMaker IA subyacente en la que se delegan las llamadas al servicio de SageMaker IA. N/A N/A Parámetro sagemaker_session. Si no se especifica, se crea una mediante una cadena de configuración predeterminada.
Función ARN El nombre del recurso de Amazon del rol (ARN) utilizado con el trabajo de notebook. Rol de campoARN. El valor predeterminado de este campo es el rol de ejecución de Studio. Cambie este campo a un valor personalizado si es necesario.
nota

Si Studio no puede deducir este valor, el ARN campo Función está en blanco. En ese caso, ARN inserte el que desee usar.

Rol de campoARN. El valor predeterminado de este campo es cualquier rol con el prefijo SagemakerJupyterScheduler. Si tiene varios roles con el prefijo, la extensión elige uno. Cambie este campo a un valor personalizado si es necesario. Para este campo, puede establecer su propia configuración de usuario predeterminada, que se rellena automáticamente cada vez que crea una nueva definición de trabajo. Para obtener más información, consulte Configuración de opciones predeterminadas para los cuadernos locales. Parámetro role. El IAM rol predeterminado es el de SageMaker IA si SDK se ejecuta en SageMaker Notebooks o SageMaker Studio Notebooks. De lo contrario, emite un ValueError. Permite valores predeterminados inteligentes.
Cuaderno de entrada El nombre del cuaderno cuya ejecución va a programar. Obligatorio. Campo Archivo de entrada. Igual que Studio. Parámetro obligatorio input_notebook
Carpeta de entrada La carpeta que contiene las entradas. En esta carpeta se colocan las entradas del trabajo, incluido el cuaderno de entradas y cualquier script de inicio o inicialización opcional. Campo Carpeta de entrada. Si no proporciona una carpeta, el programador crea un bucket de Amazon S3 predeterminado para sus entradas. Igual que Studio. Para este campo, puede establecer su propia configuración de usuario predeterminada, que se rellena automáticamente cada vez que crea una nueva definición de trabajo. Para obtener más información, consulte Configuración de opciones predeterminadas para los cuadernos locales. N/D. La carpeta de entrada se coloca dentro de la ubicación especificada por el parámetro s3_root_uri.
Carpeta de salida La carpeta que contiene las salidas. En esta carpeta se colocan las salidas de los trabajos, incluidos el cuaderno de salidas y los registros. Campo Carpeta de entrada. Si no especifica una carpeta, el programador crea un bucket de Amazon S3 predeterminado para sus salidas. Igual que Studio. Para este campo, puede establecer su propia configuración de usuario predeterminada, que se rellena automáticamente cada vez que crea una nueva definición de trabajo. Para obtener más información, consulte Configuración de opciones predeterminadas para los cuadernos locales. N/D. La carpeta de salida se coloca dentro de la ubicación especificada por el parámetro s3_root_uri.
Parámetros Un diccionario de variables y valores para pasar al trabajo de cuaderno. Campo Parámetros. Debe parametrizar el cuaderno para aceptar los parámetros. Igual que Studio. Parámetro parameters. Debe parametrizar el cuaderno para aceptar los parámetros.
Dependencias adicionales (archivo o carpeta) La lista de dependencias de archivos o carpetas que el trabajo de cuaderno carga en la carpeta provisional s3. No admitido. No admitido. Parámetro additional_dependencies. El trabajo de cuaderno carga estas dependencias en una carpeta provisional de S3 para que puedan consumirse durante la ejecución.
Raíz S3 URI La carpeta que contiene las entradas. En esta carpeta se colocan las entradas del trabajo, incluido el cuaderno de entradas y cualquier script de inicio o inicialización opcional. N/D. Utilice Carpeta de entrada y Carpeta de salida. Igual que Studio. Parámetro s3_root_uri. El valor predeterminado es un bucket de S3 predeterminado. Permite valores predeterminados inteligentes.
Variables de entorno Cualquier variable de entorno existente que desee anular o cualquier variable de entorno nueva que desee ingresar y utilizar en su cuaderno. Campo Variables de entorno. Igual que Studio. Parámetro environment_variables. El valor predeterminado es None.
Tags Una lista de etiquetas asociadas al trabajo. N/A N/A Parámetro tags. El valor predeterminado es None. Sus etiquetas controlan la forma en que la interfaz de usuario de Studio captura y muestra el trabajo creado por la canalización. Para obtener más información, consulte Consulte los trabajos de cuaderno en el panel de la interfaz de usuario de Studio.
Script de inicio Un script precargado en el menú de inicio del cuaderno que puede elegir ejecutar antes de ejecutar el cuaderno. Campo Script de inicio. Seleccione un script de configuración del ciclo de vida (LCC) que se ejecute en la imagen al iniciarse.
nota

Un script de inicio se ejecuta en un intérprete de comandos fuera del entorno de Studio. Por lo tanto, este script no puede depender del almacenamiento local de Studio, de las variables de entorno ni de los metadatos de la aplicación (en /opt/ml/metadata). Además, si utiliza un script de inicio y un script de inicialización, el script de inicio se ejecutará primero.

No admitido. No admitido.
Script de inicialización Una ruta a un script local que puede ejecutar cuando se inicia el cuaderno. Campo Script de inicialización. Introduzca la ruta del EFS archivo donde se encuentra un script local o un script de Lifecycle Configuration (LCC). Si utiliza un script de inicio y un script de inicialización, el script de inicio se ejecutará primero.
nota

El script de inicialización proviene del mismo intérprete de comandos que el trabajo del cuaderno. Este no es el caso de un script de inicio descrito anteriormente. Además, si utiliza un script de inicio y un script de inicialización, el script de inicio se ejecutará primero.

Campo Script de inicialización. Introduzca la ruta del archivo local donde se encuentra un script local o un script de Lifecycle Configuration (LCC). Parámetro initialization_script. El valor predeterminado es None.
Número máximo de reintentos Número de veces que Studio intenta volver a ejecutar un trabajo que no tiene éxito. Campo Reintentos máximos. El valor predeterminado es 1. Igual que Studio. Parámetro max_retry_attempts. El valor predeterminado es 1.
Tiempo máximo de ejecución (en segundos) El tiempo máximo, en segundos, que un trabajo de cuaderno puede ejecutarse antes de que se detenga. Si configura tanto el tiempo máximo de ejecución como el máximo de reintentos, el tiempo de ejecución se aplica a cada reintento. Si un trabajo no se completa en este tiempo, su estado se establece en Failed. Campo Tiempo máximo de ejecución (en segundos). El valor predeterminado es 172800 seconds (2 days). Igual que Studio. Parámetro max_runtime_in_seconds. El valor predeterminado es 172800 seconds (2 days).
Políticas de reintentos Una lista de políticas de reintentos, que rigen las acciones que se deben realizar en caso de error. No admitido. No admitido. Parámetro retry_policies. El valor predeterminado es None.
Añada dependencias Step o StepCollection Una lista de nombres Step o StepCollection o instancias de los que depende el trabajo. No admitido. No admitido. Parámetro depends_on. El valor predeterminado es None. Utilícelo para definir dependencias explícitas entre los pasos de su gráfico de canalización.
Tamaño del volumen El tamaño en GB del volumen de almacenamiento para almacenar los datos de entrada y salida durante el entrenamiento. No admitido. No admitido. Parámetro volume_size. El valor predeterminado es 30 GB.
Cifrado del tráfico entre contenedores Un indicador que especifica si el tráfico entre los contenedores de entrenamiento está cifrado para el trabajo de entrenamiento. N/D. Habilitado de forma predeterminada. N/D. Habilitado de forma predeterminada. Parámetro encrypt_inter_container_traffic. El valor predeterminado es True.
Configurar el cifrado de trabajos Un indicador de que desea cifrar las salidas de los trabajos de su cuaderno, el volumen de las instancias de trabajo o ambos. Campo Configurar el cifrado de trabajos. Marque esta casilla para elegir el cifrado. Si no se selecciona, los resultados de los trabajos se cifran con la KMS clave predeterminada de la cuenta y el volumen de la instancia de trabajo no se cifra. Igual que Studio. No admitido.
Clave de cifrado de KMS salida Una KMS clave que puede utilizar si desea personalizar la clave de cifrado utilizada para los resultados de los trabajos de su portátil. Este campo solo es aplicable si ha marcado Configurar el cifrado de trabajos. KMSClave de cifrado Field Output. Si no especifica este campo, los resultados de los trabajos de su portátil se cifran KMS con SSE la KMS clave Amazon S3 predeterminada. Además, si crea el bucket de Amazon S3 usted mismo y utiliza el cifrado, se conserva el método de cifrado. Igual que Studio. Para este campo, puede establecer su propia configuración de usuario predeterminada, que se rellena automáticamente cada vez que crea una nueva definición de trabajo. Para obtener más información, consulte Configuración de opciones predeterminadas para los cuadernos locales. Parámetro s3_kms_key. El valor predeterminado es None. Permite valores predeterminados inteligentes.
KMSClave de cifrado de volumen de la instancia de trabajo Una KMS clave que puede utilizar si quiere cifrar el volumen de su instancia de trabajo. Este campo solo es aplicable si ha marcado Configurar el cifrado de trabajos. KMSClave de cifrado del volumen de la instancia Field Job. KMSClave de cifrado del volumen de la instancia Field Job. Para este campo, puede establecer su propia configuración de usuario predeterminada, que se rellena automáticamente cada vez que crea una nueva definición de trabajo. Para obtener más información, consulte Configuración de opciones predeterminadas para los cuadernos locales. Parámetro volume_kms_key. El valor predeterminado es None. Permite valores predeterminados inteligentes.
Utilice una nube privada virtual para ejecutar este trabajo (para VPC los usuarios) Un indicador de que desea ejecutar este trabajo en una nube privada virtual (VPC). Para mayor seguridad, se recomienda utilizar una privadaVPC. Campo Usar una nube privada virtual para ejecutar este trabajo. Marque esta casilla si desea utilizar unVPC. Como mínimo, cree los siguientes VPC puntos finales para permitir que su trabajo de portátil se conecte de forma privada a esos AWS recursos:
Si decide usar unVPC, debe especificar al menos una subred privada y al menos un grupo de seguridad en las siguientes opciones. Si no utiliza ninguna subred privada, debe tener en cuenta otras opciones de configuración. Para obtener más información, consulte No se admiten VPC subredes públicas en. Restricciones y consideraciones
Igual que Studio. N/A
Subredes (para VPC usuarios) Sus subredes. Este campo debe contener al menos una y cinco como máximo, y todas las subredes que proporcione deben ser privadas. Para obtener más información, consulte No se admiten VPC subredes públicas en. Restricciones y consideraciones Campo Subredes. Este campo se establece de forma predeterminada en las subredes asociadas al dominio de Studio, pero puede cambiarlo si es necesario. Campo Subredes. El programador no puede detectar sus subredes, por lo que debe introducir las subredes que haya configurado para ellas. VPC Parámetro subnets. El valor predeterminado es None. Permite valores predeterminados inteligentes.
Grupo (s) de seguridad (para usuarios) VPC Sus grupos de seguridad. Este campo debe contener al menos uno y un máximo de 15. Para obtener más información, consulte No se admiten VPC subredes públicas enRestricciones y consideraciones. Campo Grupos de seguridad. Este campo se establece de forma predeterminada en los grupos de seguridad asociados al dominioVPC, pero puede cambiarlo si es necesario. Campo Grupos de seguridad. El programador no puede detectar sus grupos de seguridad, por lo que debe introducir los grupos de seguridad que haya configurado para ellos. VPC Parámetro security_group_ids. El valor predeterminado es None. Permite valores predeterminados inteligentes.
Nombre El nombre del paso de trabajo de cuaderno. N/A N/A Parámetro name. Si no se especifica, se obtiene del nombre del archivo del cuaderno.
Nombre que mostrar El nombre del trabajo tal y como debería aparecer en la lista de ejecuciones de canalizaciones. N/A N/A Parámetro display_name. El valor predeterminado es None.
Descripción Una descripción del trabajo. N/A N/A Parámetro description.