Création d'une instance de SageMaker bloc-notes Amazon - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Création d'une instance de SageMaker bloc-notes Amazon

Important

Les politiques IAM personnalisées qui permettent à Amazon SageMaker Studio ou Amazon SageMaker Studio Classic de créer des SageMaker ressources Amazon doivent également accorder des autorisations pour ajouter des balises à ces ressources. L'autorisation d'ajouter des balises aux ressources est requise car Studio et Studio Classic balisent automatiquement toutes les ressources qu'ils créent. Si une politique IAM autorise Studio et Studio Classic à créer des ressources mais n'autorise pas le balisage, des erreurs « AccessDenied » peuvent se produire lors de la tentative de création de ressources. Pour plus d’informations, consultez Fournir des autorisations pour le balisage des ressources SageMaker.

AWS Politiques gérées pour Amazon SageMakerqui donnent des autorisations pour créer des SageMaker ressources incluent déjà des autorisations pour ajouter des balises lors de la création de ces ressources.

Une instance Amazon SageMaker Notebook est une instance de calcul ML exécutant l'application Jupyter Notebook. SageMaker gère la création de l'instance et des ressources associées. Utilisez les blocs-notes Jupyter dans votre instance de bloc-notes pour :

  • préparer et traiter les données

  • écrire du code pour entraîner des modèles

  • déployer des modèles sur l' SageMaker hébergement

  • testez ou validez vos modèles

Pour créer une instance de bloc-notes, utilisez la SageMaker console ou CreateNotebookInstanceAPI.

Le type d'instance de bloc-notes que vous choisissez dépend de la façon dont vous utilisez votre instance de bloc-notes. Assurez-vous que votre instance de bloc-notes n'est pas liée à la mémoire, au processeur ou aux E/S. Pour charger un ensemble de données en mémoire sur l'instance du bloc-notes à des fins d'exploration ou de prétraitement, choisissez un type d'instance avec suffisamment de mémoire RAM pour votre ensemble de données. Cela nécessite une instance dotée d'au moins 16 Go de mémoire (.xlarge ou plus). Si vous envisagez d'utiliser le bloc-notes pour un prétraitement intensif, nous vous recommandons de choisir une instance optimisée pour le calcul, telle qu'une instance c4 ou c5.

Lorsque vous utilisez un SageMaker bloc-notes, il est recommandé d'utiliser l'instance du bloc-notes pour orchestrer d'autres AWS services. Par exemple, vous pouvez utiliser l'instance de bloc-notes pour gérer le traitement d'ensembles de données volumineux. Pour ce faire, appelez les services AWS Glue for ETL (extract, transform, and load) ou Amazon EMR pour le mappage et la réduction des données à l'aide de Hadoop. Vous pouvez utiliser AWS les services comme des formes temporaires de calcul ou de stockage de vos données.

Vous pouvez stocker et récupérer vos données d'entraînement et de test à l'aide d'un bucket Amazon Simple Storage Service. Vous pouvez ensuite l'utiliser SageMaker pour entraîner et construire votre modèle. Par conséquent, le type d'instance de votre bloc-notes n'aura aucune incidence sur la rapidité de l'entraînement et des tests de votre modèle.

Après avoir reçu la demande, SageMaker effectue les opérations suivantes :

  • Crée une interface réseau : si vous choisissez la configuration VPC facultative SageMaker , crée l'interface réseau dans votre VPC. Il utilise l'ID de sous-réseau que vous fournissez dans la demande pour déterminer dans quelle zone de disponibilité créer le sous-réseau. SageMaker associe le groupe de sécurité que vous indiquez dans la demande au sous-réseau. Pour plus d’informations, consultez Connecter une instance de bloc-notes dans un VPC à des ressources externes.

  • Lance une instance de calcul ML : SageMaker lance une instance de calcul ML dans un SageMaker VPC. SageMaker exécute les tâches de configuration qui lui permettent de gérer votre instance de bloc-notes. Si vous avez spécifié votre VPC, SageMaker active le trafic entre votre VPC et l'instance du bloc-notes.

  • Installe les packages et bibliothèques Anaconda pour les plateformes d'apprentissage profond courantes : SageMaker installe tous les packages Anaconda inclus dans le programme d'installation. Pour plus d'informations, consultez la liste des packages Anaconda. SageMaker installe également les bibliothèques d'apprentissage profond TensorFlow et Apache MXNet.

  • Attache un volume de stockage ML : SageMaker attache un volume de stockage ML à l'instance de calcul ML. Vous pouvez utiliser le volume comme zone de travail pour nettoyer le jeu de données d'entraînement ou pour stocker temporairement des données de validation, de test ou d'autres données. Pour le volume, choisissez n'importe quelle taille comprise entre 5 Go et 16 384 Go, par incréments de 1 Go. La valeur par défaut est 5 Go. Les volumes de stockage ML étant chiffrés, il est SageMaker impossible de déterminer la quantité d'espace libre disponible sur le volume. Pour cette raison, vous pouvez augmenter la taille du volume lorsque vous mettez à jour une instance de bloc-notes, mais vous ne pouvez pas réduire la taille de volume. Si vous souhaitez réduire la taille du volume de stockage ML utilisé, créez une nouvelle instance de bloc-notes avec la taille souhaitée.

    Seuls les fichiers et les données enregistrés dans le dossier /home/ec2-user/SageMaker sont conservés entre les sessions d'instance de bloc-notes. Les fichiers et les données enregistrés en dehors de ce répertoire sont remplacés lorsque l'instance de bloc-notes s'arrête et redémarre. Chaque répertoire /tmp d'instance de bloc-notes offre un stockage minimum instantané de 10 Go dans une instance de bloc-notes. Un stockage d'instance offre un stockage temporaire de niveau bloc qui n'est pas conservé. Lorsque l'instance est arrêtée ou redémarrée, le SageMaker contenu du répertoire est supprimé. Ce stockage temporaire fait partie du volume racine de l'instance bloc-notes.

    Si le type d'instance utilisé par l'instance portable prend en charge le protocole NVMe, les clients peuvent utiliser les volumes de stockage d'instance NVMe disponibles pour ce type d'instance. Pour les instances dotées de volumes de stockage NVMe, tous les volumes de stockage d'instance sont automatiquement attachés à l'instance au lancement. Pour plus d'informations sur les types d'instances et les volumes de stockage NVMe associés, consultez les détails du type d'instance Amazon Elastic Compute Cloud.

    Pour rendre le volume de stockage NVMe attaché disponible pour votre instance d'ordinateur portable, suivez les étapes décrites dans Rendre les volumes de stockage d'instance disponibles sur votre instance. Effectuez les étapes avec un accès root ou à l'aide d'un script de configuration du cycle de vie.

    Note

    Les volumes de stockage d'instance NVMe ne sont pas des volumes de stockage persistants. Ce stockage est de courte durée avec l'instance et doit être reconfiguré chaque fois qu'une instance dotée de ce stockage est lancée.

  • Exemples de blocs-notes Jupyter : ces exemples de code Python montrent des exercices d'entraînement et d'hébergement de modèles utilisant différents algorithmes et ensembles de données d'entraînement.

Pour créer une instance de SageMaker bloc-notes :
  1. Ouvrez la SageMaker console à l'adresse https://console.aws.amazon.com/sagemaker/.

  2. Choisissez Instances de bloc-notes, puis Créer une instance de bloc-notes.

  3. Sur la page Créer une instance de bloc-notes, fournissez les informations suivantes :

    1. Pour Notebook instance name (Nom d'instance de bloc-notes), saisissez un nom pour votre ordinateur bloc-notes.

    2. Pour Notebook instance type (Type d'instance de bloc-notes), choisissez une taille d'instance adaptée à votre cas d'utilisation. Pour obtenir la liste des types d'instances et des quotas pris en charge, consultez Amazon SageMaker Service Quotas.

    3. Pour Elastic Inference, choisissez un type d'accélérateur d'inférence à associer à l'instance de bloc-notes si vous prévoyez d'effectuer des inférences à partir de l'instance de bloc-notes. Si vous ne prévoyez pas d'effectuer d'inférence à partir de l'instance du bloc-notes, choisissez-en aucune. Pour de plus amples informations sur l'inférence élastique, veuillez consulter Utiliser Amazon SageMaker Elastic Inference (EI) .

    4. Pour Platform Identifier (Identificateur de plateforme), choisissez un type de plateforme sur lequel créer l'instance de bloc-notes. Ce type de plate-forme détermine le système d'exploitation et la JupyterLab version avec lesquels votre instance de bloc-notes est créée. Pour plus d'informations sur le type d'identificateur de plateforme, veuillez consulter Instances de bloc-notes Amazon Linux 2. Pour plus d'informations sur les versions JupyterLab, veuillez consulter JupyterLab gestion des versions.

    5. (Facultatif) L'Additional configuration (configuration supplémentaire) permet aux utilisateurs avancés de créer un script shell qui peut s'exécuter lorsque vous créez ou démarrez l'instance. Ce script, appelé script de configuration du cycle de vie, peut être utilisé pour définir l'environnement du bloc-notes ou pour exécuter d'autres fonctions. Pour plus d'informations, veuillez consulter Personnalisation d'une instance de SageMaker bloc-notes à l'aide d'un script LCC.

    6. (Facultatif) La configuration supplémentaire vous permet également de spécifier la taille, en Go, du volume de stockage ML attaché à l'instance de bloc-notes. Vous pouvez choisir une taille comprise entre 5 et 16,384 Go, par incréments de 1 Go. Vous pouvez utiliser le volume pour nettoyer le jeu de données d'entraînement ou stocker temporairement des données de validation ou d'autres données.

    7. (Facultatif) Pour Minimum IMDS Version (Version IMDS minimale), sélectionnez une version dans la liste déroulante. Si cette valeur est définie sur v1, les deux versions peuvent être utilisées avec l'instance de bloc-notes. Si v2 est sélectionné, seule IMDSv2 peut être utilisée avec l'instance de bloc-notes. Pour plus d'informations sur IMDSv2, consultez Utiliser IMDSv2.

      Note

      À compter du 31 octobre 2022, la version minimale IMDS par défaut pour les instances d' SageMaker ordinateurs portables passe d'IMDSv1 à IMDSv2.

      À compter du 1er février 2023, IMDSv1 ne sera plus disponible pour la création de nouvelles instances de bloc-notes. Après cette date, vous pouvez créer des instances de bloc-notes avec une version IMDS minimale de 2.

    8. Pour le rôle IAM, choisissez soit un rôle IAM existant dans votre compte avec les autorisations nécessaires pour accéder aux SageMaker ressources, soit créer un nouveau rôle. Si vous choisissez Créer un nouveau rôle, SageMaker crée un rôle IAM nomméAmazonSageMaker-ExecutionRole-YYYYMMDDTHHmmSS. La politique AWS gérée AmazonSageMakerFullAccess est attachée au rôle. Le rôle fournit des autorisations qui permettent à l'instance du bloc-notes SageMaker d'appeler Amazon S3.

    9. Pour l'accès root, pour accorder un accès root à tous les utilisateurs d'instances de bloc-notes, choisissez Enable. Pour supprimer l'accès root pour les utilisateurs, choisissez Désactiver. Si vous accordez un accès root, tous les utilisateurs d'une instance de bloc-notes ont des privilèges d'administrateur et peuvent accéder à tous les fichiers qu'elle contient et les modifier.

    10. (Facultatif) La clé de chiffrement vous permet de chiffrer des données sur le volume de stockage ML attaché à l'instance de bloc-notes à l'aide d'une clé AWS Key Management Service (AWS KMS). Si vous envisagez de stocker des informations sensibles sur le volume de stockage de Machine Learning, envisagez de les chiffrer.

    11. (Facultatif) Le réseau vous permet de placer votre instance de bloc-notes dans un Virtual Private Cloud (VPC). Un VPC fournit une sécurité supplémentaire et limite l'accès aux ressources du VPC à partir de sources extérieures au VPC. Pour plus d'information sur VPC, veuillez consulter le Guide de l'utilisateur Amazon VPC.

      Pour ajouter votre instance de bloc-notes à un VPC :

      1. Choisissez le VPC et un. SubnetId

      2. Pour Security Group (Groupe de sécurité), sélectionnez le groupe de sécurité par défaut de votre VPC.

      3. Si vous avez besoin de votre instance de bloc-notes pour accéder à Internet, activez l'accès direct à Internet. Pour Direct internet access (Accès Internet direct), choisissez Enable (activer). L'accès à Internet peut rendre votre instance de bloc-notes moins sécurisée. Pour plus d’informations, consultez Connecter une instance de bloc-notes dans un VPC à des ressources externes.

    12. (Facultatif) Pour associer des référentiels git à l'instance de bloc-notes, choisissez un référentiel par défaut et jusqu'à 3 référentiels supplémentaires. Pour plus d’informations, consultez Associer des référentiels Git à des instances de SageMaker Notebook.

    13. Choisissez Create notebook instance (Créer une instance de bloc-notes).

      En quelques minutes, Amazon SageMaker lance une instance de calcul ML (dans ce cas, une instance de bloc-notes) et y attache un volume de stockage ML. L'instance de bloc-notes possède un serveur de blocs-notes Jupyter préconfiguré et un ensemble de bibliothèques Anaconda. Pour de plus amples informations, veuillez consulter l'API CreateNotebookInstance.

  4. Lorsque l'état de l'instance de bloc-notes est InService, dans la console, l'instance de bloc-notes est prête à l'emploi. Choisissez Open Jupyter (Ouvrir Jupyter) en regard du nom du bloc-notes pour ouvrir le tableau de bord Jupyter classique.

    Note

    Pour renforcer la sécurité de votre instance de SageMaker bloc-notes Amazon, tous les notebook.region.sagemaker.aws domaines régionaux sont enregistrés dans la liste des suffixes publics (PSL) Internet. Pour plus de sécurité, nous vous recommandons d'utiliser des cookies avec un __Host- préfixe pour définir des cookies sensibles pour les domaines des instances de votre SageMaker bloc-notes. Cela vous permettra de protéger votre domaine contre les tentatives de falsification de requêtes intersites (CSRF). Pour plus d'informations, consultez la page Set-Cookie sur le site web de documentation pour développeurs de mozilla.org.

    Vous pouvez choisir Ouvrir JupyterLab pour ouvrir le JupyterLab tableau de bord. Le tableau de bord permet d'accéder à votre instance de bloc-notes et à des exemples de SageMaker blocs-notes contenant des instructions détaillées sur le code. Ces procédures pas à pas montrent comment effectuer des tâches SageMaker d'apprentissage automatique courantes. Pour plus d’informations, consultez Exemples de blocs-notes. Pour plus d’informations, consultez Contrôler l'accès root à une instance de SageMaker bloc-notes.

    Pour de plus amples informations sur les blocs-notes Jupyter, veuillez consulter Jupyter.