Options disponibles - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Options disponibles

Le tableau suivant présente toutes les options disponibles que vous pouvez utiliser pour personnaliser votre tâche de bloc-notes, que vous exécutiez votre tâche de bloc-notes dans Studio, dans un environnement Jupyter local ou que vous utilisiez Python SageMaker . SDK Le tableau inclut le type d'option personnalisée, une description, des instructions supplémentaires sur la façon d'utiliser l'option, un nom de champ pour l'option dans Studio (si disponible) et le nom du paramètre pour l'étape de travail du bloc-notes dans SageMaker Python SDK (si disponible).

Pour certaines options, vous pouvez également prédéfinir des valeurs par défaut personnalisées afin de ne pas avoir à les spécifier chaque fois que vous configurez une tâche de bloc-notes. Pour Studio, ces options sont le rôle, le dossier d'entrée, le dossier de sortie et l'ID de KMS clé. Elles sont spécifiées dans le tableau suivant. Si vous définissez des valeurs par défaut personnalisées pour ces options, ces champs sont préremplis dans le formulaire Create Job lorsque vous créez votre tâche de bloc-notes. Pour plus de détails sur la façon de créer des valeurs par défaut personnalisées dans Studio et les environnements Jupyter locaux, consultez. Configurer les options par défaut pour les blocs-notes locaux

Cela vous donne SageMaker SDK également la possibilité de définir des valeurs par défaut intelligentes afin que vous n'ayez pas à spécifier ces paramètres lorsque vous créez unNotebookJobStep. Ces paramètres sontrole,s3_root_uri,s3_kms_key,volume_kms_key, subnetssecurity_group_ids, et sont spécifiés dans le tableau suivant. Pour plus d'informations sur la façon de définir des valeurs par défaut intelligentes, consultezConfigurer les options par défaut.

Option personnalisée Description Directive spécifique à Studio Directive environnementale locale de Jupyter SageMaker SDKDirective Python
Nom de la tâche Le nom de votre travail tel qu'il doit apparaître dans le tableau de bord Notebook Jobs. Nom du champ Job. Identique à Studio. Paramètrenotebook_job_name. La valeur par défaut est None.
Image Image de conteneur utilisée pour exécuter le bloc-notes de manière non interactive sur le type de calcul choisi. Image de terrain. Ce champ contient par défaut l'image actuelle de votre bloc-notes. Remplacez la valeur par défaut de ce champ par une valeur personnalisée, si nécessaire. Si Studio ne peut pas déduire cette valeur, le formulaire affiche une erreur de validation vous demandant de la spécifier. Cette image peut être une image personnalisée, une bring-your-own image ou une SageMaker image Amazon disponible. Pour obtenir la liste des SageMaker images disponibles prises en charge par le planificateur de bloc-notes, consultez. SageMaker Images Amazon disponibles pour utilisation avec Studio Classic Image de terrain. Ce champ nécessite une image Docker capable ECR URI d'exécuter le bloc-notes fourni sur le type de calcul sélectionné. Par défaut, l'extension du planificateur utilise une image SageMaker Docker prédéfinie, basée sur Python 2.0. Il s'agit de l'image officielle de Python 3.8 provenant de DockerHub boto3 et du noyau Python 3. AWS CLI Vous pouvez également fournir toute image conforme ECR URI aux spécifications d'image personnalisées du bloc-notes. Pour plus de détails, consultez Spécifications SageMaker d'image personnalisées. Cette image doit contenir tous les noyaux et bibliothèques nécessaires à l'exécution du bloc-notes. Obligatoire. Paramètreimage_uri. URIemplacement d'une image Docker surECR. Vous pouvez utiliser des images de SageMaker distribution spécifiques ou une image personnalisée basée sur ces images, ou votre propre image préinstallée avec des dépendances entre les tâches du bloc-notes répondant à des exigences supplémentaires. Pour plus de détails, consultez Contraintes d'image pour les tâches liées aux SDK blocs-notes en SageMaker Python.
Type d’instance Type d'EC2instance à utiliser pour exécuter la tâche de bloc-notes. La tâche de bloc-notes utilise une tâche d' SageMaker entraînement comme couche informatique. Le type d'instance spécifié doit donc être un type d'instance compatible avec la SageMaker formation. Type de calcul sur le terrain. La valeur par défaut est ml.m5.large. Identique à Studio. Paramètreinstance_type. La valeur par défaut est ml.m5.large.
Noyau Le noyau Jupyter utilisé pour exécuter la tâche du bloc-notes. Field Kernel. Ce champ contient par défaut le noyau actuel de votre bloc-notes. Remplacez la valeur par défaut de ce champ par une valeur personnalisée, si nécessaire. Si Studio ne peut pas déduire cette valeur, le formulaire affiche une erreur de validation vous demandant de la spécifier. Field Kernel. Ce noyau doit être présent dans l'image et respecter les spécifications du noyau Jupyter. Ce champ correspond par défaut au noyau Python3 présent dans l'image de base de Python 2.0. SageMaker Modifiez ce champ en spécifiant une valeur personnalisée, si nécessaire. Obligatoire. Paramètrekernel_name. Ce noyau doit être présent dans l'image et respecter les spécifications du noyau Jupyter. Pour voir les identifiants du noyau de votre image, consultez (LINK).
SageMaker séance SageMaker Session sous-jacente à laquelle les appels SageMaker de service sont délégués. N/A N/A Paramètresagemaker_session. Si ce n'est pas spécifié, il est créé à l'aide d'une chaîne de configuration par défaut.
Rôle ARN Le nom de ressource Amazon du rôle (ARN) utilisé pour la tâche de bloc-notes. Rôle sur le terrainARN. Ce champ utilise par défaut le rôle d'exécution Studio. Modifiez ce champ en spécifiant une valeur personnalisée, si nécessaire.
Note

Si Studio ne peut pas déduire cette valeur, le ARN champ Rôle est vide. Dans ce cas, insérez le que ARN vous souhaitez utiliser.

Rôle sur le terrainARN. Ce champ contient par défaut n'importe quel rôle préfixé par SagemakerJupyterScheduler. Si vous avez plusieurs rôles avec le préfixe, l'extension en choisit un. Modifiez ce champ en spécifiant une valeur personnalisée, si nécessaire. Pour ce champ, vous pouvez définir votre propre valeur par défaut d'utilisateur qui est préremplie chaque fois que vous créez une nouvelle définition de tâche. Pour plus de détails, consultez Configurer les options par défaut pour les blocs-notes locaux. Paramètrerole. Le IAM rôle par défaut est utilisé SageMaker par défaut s'il SDK est exécuté dans des blocs-notes ou SageMaker des blocs-notes SageMaker Studio. Sinon, il lance unValueError. Permet des valeurs par défaut intelligentes.
Carnet de saisie Nom du bloc-notes que vous planifiez d'exécuter. Obligatoire. Fichier de saisie de champ. Identique à Studio. Paramètre obligatoire. input_notebook
Input folder (Dossier d'entrée) Dossier contenant vos entrées. Les entrées de tâche, y compris le bloc-notes d'entrée et tous les scripts de démarrage ou d'initialisation facultatifs, sont placées dans ce dossier. Dossier Field Input. Si vous ne spécifiez pas de dossier, le planificateur crée un compartiment Amazon S3 par défaut pour vos entrées. Identique à Studio. Pour ce champ, vous pouvez définir votre propre valeur par défaut d'utilisateur qui est préremplie chaque fois que vous créez une nouvelle définition de tâche. Pour plus de détails, consultez Configurer les options par défaut pour les blocs-notes locaux. N/A. Le dossier d'entrée est placé à l'emplacement spécifié par le paramètres3_root_uri.
Output folder (Dossier de sortie) Le dossier contenant vos sorties. Les sorties de tâche, y compris le bloc-notes de sortie et les journaux, sont placées dans ce dossier. Dossier Field Output. Si vous ne spécifiez pas de dossier, le planificateur crée un compartiment Amazon S3 par défaut pour vos sorties. Identique à Studio. Pour ce champ, vous pouvez définir votre propre valeur par défaut d'utilisateur qui est préremplie chaque fois que vous créez une nouvelle définition de tâche. Pour plus de détails, consultez Configurer les options par défaut pour les blocs-notes locaux. N/A. Le dossier de sortie est placé à l'emplacement spécifié par le paramètres3_root_uri.
Paramètres Un dictionnaire de variables et de valeurs à transmettre à votre tâche de bloc-notes. Paramètres du champ. Vous devez paramétrer votre bloc-notes pour accepter les paramètres. Identique à Studio. Paramètreparameters. Vous devez paramétrer votre bloc-notes pour accepter les paramètres.
Dépendances supplémentaires (fichier ou dossier) La liste des dépendances de fichiers ou de dossiers que la tâche du bloc-notes télécharge dans le dossier intermédiaire s3. Non pris en charge. Non pris en charge. Paramètreadditional_dependencies. La tâche de bloc-notes télécharge ces dépendances dans un dossier intermédiaire S3 afin qu'elles puissent être consommées pendant l'exécution.
Racine S3 URI Dossier contenant vos entrées. Les entrées de tâche, y compris le bloc-notes d'entrée et tous les scripts de démarrage ou d'initialisation facultatifs, sont placées dans ce dossier. N/A. Utilisez le dossier d'entrée et le dossier de sortie. Identique à Studio. Paramètres3_root_uri. La valeur par défaut est un compartiment S3 par défaut. Permet des valeurs par défaut intelligentes.
Variables d’environnement Toutes les variables d'environnement existantes que vous souhaitez remplacer ou les nouvelles variables d'environnement que vous souhaitez introduire et utiliser dans votre bloc-notes. Variables d'environnement de terrain. Identique à Studio. Paramètreenvironment_variables. La valeur par défaut est None.
Balises Liste des balises associées à la tâche. N/A N/A Paramètretags. La valeur par défaut est None. Vos balises contrôlent la manière dont l'interface utilisateur de Studio capture et affiche la tâche créée par le pipeline. Pour plus de détails, consultez Consultez les tâches de votre bloc-notes dans le tableau de bord de l'interface utilisateur de Studio.
Start-up script (Script de démarrage) Script préchargé dans le menu de démarrage du bloc-notes que vous pouvez choisir d'exécuter avant d'exécuter le bloc-notes. Script de démarrage sur le terrain. Sélectionnez un script Lifecycle Configuration (LCC) qui s'exécute sur l'image au démarrage.
Note

Un script de démarrage s'exécute dans un shell en dehors de l'environnement Studio. Ce script ne peut donc pas dépendre du stockage local de Studio, des variables d'environnement ni des métadonnées de l'application (dans /opt/ml/metadata). De même, si vous utilisez un script de démarrage et un script d'initialisation, le script de démarrage s'exécute en premier.

Non pris en charge. Non pris en charge.
Initialization script (Script d'initialisation) Chemin d'accès à un script local que vous pouvez exécuter au démarrage de votre bloc-notes. Script d'initialisation des champs. Entrez le chemin du EFS fichier dans lequel se trouve un script local ou un script Lifecycle Configuration (LCC). Si vous utilisez un script de démarrage et un script d'initialisation, le script de démarrage s'exécute en premier.
Note

Un script d'initialisation provient du même shell que la tâche de bloc-notes. Ce n'est pas le cas pour un script de démarrage décrit précédemment. De même, si vous utilisez un script de démarrage et un script d'initialisation, le script de démarrage s'exécute en premier.

Script d'initialisation des champs. Entrez le chemin du fichier local où se trouve un script local ou un script Lifecycle Configuration (LCC). Paramètreinitialization_script. La valeur par défaut est None.
Nombre maximal de nouvelles tentatives Nombre de fois où Studio essaie de réexécuter une tâche qui a échoué. Field Max tente de nouveau. La valeur par défaut est 1. Identique à Studio. Paramètremax_retry_attempts. La valeur par défaut est 1.
Durée d'exécution maximale (en secondes) Durée maximale, en secondes, pendant laquelle une tâche de bloc-notes peut s'exécuter avant d'être arrêtée. Si vous configurez à la fois la durée d'exécution maximale et le nombre maximal de nouvelles tentatives, la durée d'exécution s'applique à chaque nouvelle tentative. Si une tâche ne se termine pas dans ce délai, son statut est défini sur Failed. Durée d'exécution maximale du champ (en secondes). La valeur par défaut est 172800 seconds (2 days). Identique à Studio. Paramètremax_runtime_in_seconds. La valeur par défaut est 172800 seconds (2 days).
Politiques relatives aux nouvelles tentatives Liste des politiques relatives aux nouvelles tentatives, qui régissent les actions à entreprendre en cas d'échec. Non pris en charge. Non pris en charge. Paramètreretry_policies. La valeur par défaut est None.
Ajouter Step ou StepCollection dépendances Une liste de StepCollection noms Step ou d'instances dont dépend la tâche. Non pris en charge. Non pris en charge. Paramètredepends_on. La valeur par défaut est None. Utilisez-le pour définir des dépendances explicites entre les étapes de votre graphe de pipeline.
Taille du volume Taille en Go du volume de stockage pour le stockage des données d'entrée et de sortie pendant l'entraînement. Non pris en charge. Non pris en charge. Paramètrevolume_size. La valeur par défaut est de 30 Go.
Chiffrez le trafic entre les conteneurs Indicateur qui indique si le trafic entre les conteneurs de formation est chiffré pour la tâche de formation. N/A. Activé par défaut. N/A. Activé par défaut. Paramètreencrypt_inter_container_traffic. La valeur par défaut est True.
Configure job encryption (Configurer le chiffrement des tâches) Indicateur du fait que vous souhaitez chiffrer vos sorties de tâche de bloc-notes, votre volume d'instance de tâche, ou les deux. Champ Configurer le chiffrement des tâches. Cochez cette case pour choisir le chiffrement. Si cette case n'est pas cochée, les résultats de la tâche sont chiffrés avec la KMS clé par défaut du compte et le volume de l'instance de tâche n'est pas chiffré. Identique à Studio. Non pris en charge.
Clé de KMS chiffrement de sortie KMSClé à utiliser si vous souhaitez personnaliser la clé de chiffrement utilisée pour les résultats des tâches de votre bloc-notes. Ce champ n'est applicable que si vous avez activé l'option Configurer le chiffrement des tâches. KMSClé de chiffrement Field Output. Si vous ne spécifiez pas ce champ, les résultats de vos tâches de bloc-notes sont chiffrés SSE à KMS l'aide de la KMS clé Amazon S3 par défaut. De même, si vous créez vous-même le compartiment Amazon S3 et utilisez le chiffrement, votre méthode de chiffrement est préservée. Identique à Studio. Pour ce champ, vous pouvez définir votre propre valeur par défaut d'utilisateur qui est préremplie chaque fois que vous créez une nouvelle définition de tâche. Pour plus de détails, consultez Configurer les options par défaut pour les blocs-notes locaux. Paramètres3_kms_key. La valeur par défaut est None. Permet des valeurs par défaut intelligentes.
KMSClé de chiffrement du volume de l'instance Job KMSClé à utiliser si vous souhaitez chiffrer le volume de votre instance de tâche. Ce champ n'est applicable que si vous avez activé l'option Configurer le chiffrement des tâches. KMSClé de chiffrement du volume de l'instance Field Job. KMSClé de chiffrement du volume de l'instance Field Job. Pour ce champ, vous pouvez définir votre propre valeur par défaut d'utilisateur qui est préremplie chaque fois que vous créez une nouvelle définition de tâche. Pour plus de détails, consultez Configurer les options par défaut pour les blocs-notes locaux. Paramètrevolume_kms_key. La valeur par défaut est None. Permet des valeurs par défaut intelligentes.
Utiliser un cloud privé virtuel pour exécuter cette tâche (pour VPC les utilisateurs) Indicateur indiquant que vous souhaitez exécuter cette tâche dans un cloud privé virtuel (VPC). Pour une meilleure sécurité, il est recommandé d'utiliser un compte privéVPC. Champ Utilisez un cloud privé virtuel pour exécuter cette tâche. Cochez cette case si vous souhaitez utiliser unVPC. Créez au minimum les VPC points de terminaison suivants pour permettre à votre tâche de bloc-notes de se connecter de manière privée à ces AWS ressources :
Si vous choisissez d'utiliser unVPC, vous devez spécifier au moins un sous-réseau privé et au moins un groupe de sécurité dans les options suivantes. Si vous n'utilisez aucun sous-réseau privé, vous devez envisager d'autres options de configuration. Pour plus de détails, consultez la section VPCSous-réseaux publics non pris en charge dansContraintes et considérations.
Identique à Studio. N/A
Sous-réseau (s) (pour les VPC utilisateurs) Vos sous-réseaux. Ce champ doit contenir au moins une entrée et cinq au maximum, et tous les sous-réseaux que vous fournissez doivent être privés. Pour plus de détails, consultez la section VPCSous-réseaux publics non pris en charge dansContraintes et considérations. Sous-réseau (s) de champ. Ce champ contient par défaut les sous-réseaux associés au domaine Studio, mais vous pouvez modifier ce champ si nécessaire. Sous-réseau (s) de champ. Le planificateur ne peut pas détecter vos sous-réseaux. Vous devez donc saisir tous les sous-réseaux que vous avez configurés pour votre. VPC Paramètresubnets. La valeur par défaut est None. Permet des valeurs par défaut intelligentes.
Groupe (s) de sécurité (pour VPC les utilisateurs) Vos groupes de sécurité. Ce champ doit contenir au moins une entrée et quinze au maximum. Pour plus de détails, consultez la section VPCSous-réseaux publics non pris en charge dansContraintes et considérations. Groupes de sécurité sur le terrain. Ce champ contient par défaut les groupes de sécurité associés au domaineVPC, mais vous pouvez le modifier si nécessaire. Groupes de sécurité sur le terrain. Le planificateur ne peut pas détecter vos groupes de sécurité. Vous devez donc saisir les groupes de sécurité que vous avez configurés pour votre. VPC Paramètresecurity_group_ids. La valeur par défaut est None. Permet des valeurs par défaut intelligentes.
Nom Nom de l'étape de travail du bloc-notes. N/A N/A Paramètrename. S'il n'est pas spécifié, il est dérivé du nom du fichier du bloc-notes.
Nom d'affichage Le nom de votre tâche tel qu'il doit apparaître dans votre liste d'exécutions de pipeline. N/A N/A Paramètredisplay_name. La valeur par défaut est None.
Description Une description de votre travail. N/A N/A Paramètredescription.