Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Blueprints DataZone intégrés à Amazon
Un plan avec lequel un environnement est créé définit les outils et services que les membres du projet auquel appartient l'environnement peuvent utiliser lorsqu'ils travaillent avec les actifs du DataZone catalogue Amazon. Dans la version actuelle d'Amazon DataZone, il existe les plans intégrés suivants :
-
Plan du lac de données
-
Plan d'entrepôt de données
-
SageMaker Plan Amazon
Vous pouvez suivre les étapes des procédures suivantes pour activer les plans par défaut dans Amazon DataZone :
Activez les plans intégrés dans le AWS compte propriétaire du domaine Amazon DataZone
Un plan avec lequel un environnement est créé définit les outils et services que les membres du projet auquel appartient l'environnement peuvent utiliser lorsqu'ils travaillent avec les actifs du DataZone catalogue Amazon.
Dans la version actuelle d'Amazon DataZone, plusieurs plans sont intégrés : le plan du lac de données, le plan de l'entrepôt de données et le plan Amazon. SageMaker
-
Le plan du lac de données contient la définition du lancement et de la configuration d'un ensemble de services (AWS Glue, AWS Lake Formation, Amazon Athena) pour publier et utiliser les actifs des lacs de données dans le catalogue Amazon DataZone .
-
Le plan d'entrepôt de données contient la définition du lancement et de la configuration d'un ensemble de services (Amazon Redshift) pour publier et utiliser les actifs Amazon Redshift dans le catalogue Amazon. DataZone
-
Le SageMaker plan Amazon contient la définition du lancement et de la configuration d'un ensemble de services (Amazon SageMaker Studio) pour publier et utiliser les SageMaker ressources Amazon dans le DataZone catalogue Amazon.
Pour de plus amples informations, veuillez consulter DataZone Terminologie et concepts d'Amazon.
Lors de la création d'un DataZone domaine Amazon, vous avez la possibilité de choisir la configuration rapide qui active automatiquement le lac de données par défaut et les plans intégrés de l'entrepôt de données par défaut dans le cadre du processus de création du domaine. La configuration rapide crée également des profils d'environnement par défaut et des environnements par défaut pour vous à l'aide de ces plans intégrés.
Si vous ne choisissez pas Configuration rapide lors de la création de votre DataZone domaine Amazon, vous pouvez utiliser la procédure ci-dessous pour activer les plans intégrés disponibles dans le AWS compte hébergeant ce DataZone domaine Amazon. Vous devez activer ces plans intégrés avant de pouvoir les utiliser pour créer des profils d'environnement et des environnements dans ce domaine.
Pour activer les plans intégrés dans un DataZone domaine Amazon via la console de DataZone gestion Amazon, vous devez assumer un rôle IAM dans le compte avec des autorisations administratives. Configurer les autorisations IAM requises pour utiliser la console de DataZone gestion Amazonpour obtenir les autorisations minimales.
Activer les plans intégrés dans un domaine Amazon DataZone
-
Accédez à la DataZone console Amazon à l'adresse https://console.aws.amazon.com/datazone
et connectez-vous à l'aide des informations d'identification de votre compte. -
Choisissez Afficher les domaines et choisissez le domaine dans lequel vous souhaitez activer un ou plusieurs plans intégrés.
-
Sur la page des détails du domaine, accédez à l'onglet Blueprints.
-
Dans la liste des plans, choisissez le plan DefaultDataLakeou DefaultDataWarehousele SageMaker plan Amazon.
-
Sur la page de détails du plan choisi, choisissez Activer dans ce compte.
-
Sur la page Autorisations et ressources, spécifiez les éléments suivants :
-
Si vous activez le DefaultDataLakeplan, pour le rôle Glue Manage Access, spécifiez un rôle de service nouveau ou existant qui DataZone autorise Amazon à ingérer et à gérer l'accès aux tables dans AWS Glue and AWS Lake Formation.
-
Si vous activez le DefaultDataWarehouseplan, pour le rôle Redshift Manage Access, spécifiez un rôle de service nouveau ou existant qui autorise DataZone Amazon à ingérer et à gérer l'accès aux partages de données, aux tables et aux vues dans Amazon Redshift.
-
Si vous activez le SageMaker plan Amazon, pour le rôle de SageMaker gestion des accès, spécifiez un rôle de service nouveau ou existant qui accorde à Amazon l' DataZoneautorisation de publier les SageMaker données Amazon dans le catalogue. Cela donne également à Amazon l' DataZone autorisation d'accorder ou de révoquer l'accès aux ressources SageMaker publiées par Amazon dans le catalogue.
Important
Lorsque vous activez le SageMaker plan Amazon, Amazon DataZone vérifie si les rôles IAM suivants pour Amazon DataZone existent dans le compte et la région actuels. Si ces rôles n'existent pas, Amazon les crée DataZone automatiquement.
-
AmazonDataZoneGlueAccess- <region>- <domainId>
-
AmazonDataZoneRedshiftAccess- <region>- <domainId>
-
-
Pour le rôle de provisionnement, spécifiez un rôle de service nouveau ou existant qui accorde à Amazon DataZone l'autorisation de créer et de configurer les ressources de l'environnement AWS CloudFormation à l'aide du compte et de la région d'environnement.
-
Si vous activez le SageMaker plan Amazon, pour le compartiment Amazon S3 pour la source de données SageMaker -Glue, spécifiez un compartiment Amazon S3 qui doit être utilisé par tous les SageMaker environnements du AWS compte. Le préfixe de compartiment que vous spécifiez doit être l'un des suivants :
-
zone de données Amazon*
-
créateur de zones de données*
-
zone de données SageMaker*
-
DataZone- Sagemaker*
-
Sagemaker- * DataZone
-
DataZone-SageMaker*
-
SageMaker-DataZone*
-
-
-
Choisissez Activer le plan.
Une fois que vous avez activé le ou les plans choisis, vous pouvez contrôler quels projets peuvent utiliser les plans dans votre compte pour créer des profils d'environnement. Vous pouvez le faire en affectant la gestion des projets à la configuration du plan.
Important
Par défaut, aucun projet de gestion n'est spécifié pour les plans d'environnement, ce qui signifie que tout DataZone utilisateur d'Amazon peut créer des profils pour un plan d'environnement. Par conséquent, il est fortement recommandé de toujours spécifier la gestion des projets pour vos plans d'environnement afin de garantir une gouvernance plus solide.
Spécifiez la gestion des projets sur les plans activés
-
Accédez à la DataZone console Amazon à l'adresse https://console.aws.amazon.com/datazone
et connectez-vous à l'aide des informations d'identification de votre compte. -
Choisissez Afficher les domaines, puis choisissez le domaine dans lequel vous souhaitez ajouter le ou les projets de gestion pour le ou les plans choisis.
-
Choisissez l'onglet Blueprints, puis choisissez le plan avec lequel vous souhaitez travailler.
-
Par défaut, tous les projets du domaine peuvent utiliser les DefaultDataLake SageMaker plans ou Amazon du compte pour créer des profils d'environnement. DefaultDataWareshouse Toutefois, vous pouvez limiter cela en affectant la gestion des projets aux plans. Pour ajouter des projets de gestion, choisissez Sélectionner la gestion du projet, puis choisissez les projets que vous souhaitez ajouter en tant que gestion de projets dans le menu déroulant, puis sélectionnez Sélectionner la gestion de projets.
Une fois que vous avez activé le DefaultDataWarehouse plan dans votre AWS compte, vous pouvez ajouter des ensembles de paramètres à la configuration du plan. Un ensemble de paramètres est un groupe de clés et de valeurs, requis pour qu'Amazon DataZone établisse une connexion à votre cluster Amazon Redshift et est utilisé pour créer des environnements d'entrepôt de données. Ces paramètres incluent le nom de votre cluster Amazon Redshift, de votre base de données et le AWS secret contenant les informations d'identification du cluster.
Ajouter des ensembles de paramètres au DefaultDataWarehouse plan
-
Accédez à la DataZone console Amazon à l'adresse https://console.aws.amazon.com/datazone
et connectez-vous à l'aide des informations d'identification de votre compte. -
Choisissez Afficher les domaines, puis choisissez le domaine dans lequel vous souhaitez ajouter le jeu de paramètres.
-
Choisissez l'onglet Plans, puis choisissez le DefaultDataWareshouse plan pour ouvrir la page de détails du plan.
-
Dans l'onglet Ensembles de paramètres de la page de détails du plan, choisissez Créer un jeu de paramètres.
-
Entrez un nom pour le jeu de paramètres.
-
Fournissez éventuellement une description du jeu de paramètres.
-
Sélectionner une région
-
Sélectionnez le cluster Amazon Redshift ou Amazon Redshift Serverless.
-
Sélectionnez l'ARN AWS secret qui contient les informations d'identification du cluster Amazon Redshift sélectionné ou du groupe de travail Amazon Redshift Serverless. Le AWS secret doit être étiqueté avec le
AmazonDataZoneDomain : [Domain_ID]
tag afin de pouvoir être utilisé dans un ensemble de paramètres.-
Si vous n'avez pas de AWS secret existant, vous pouvez également en créer un nouveau en choisissant Créer un nouveau AWS secret. Cela ouvre une boîte de dialogue dans laquelle vous pouvez fournir le nom du secret, le nom d'utilisateur et le mot de passe. Une fois que vous avez choisi Create New AWS Secret, Amazon DataZone crée un nouveau secret dans le service AWS Secrets Manager et s'assure que le secret est étiqueté avec le domaine dans lequel vous essayez de créer le jeu de paramètres.
-
-
Si vous avez choisi le cluster Amazon Redshift à l'étape ci-dessus, choisissez maintenant un cluster dans le menu déroulant. Si vous avez choisi le groupe de travail Amazon Redshift à l'étape ci-dessus, choisissez maintenant un groupe de travail dans le menu déroulant.
-
Entrez le nom de la base de données au sein du cluster Amazon Redshift ou du groupe de travail Amazon Redshift Serverless sélectionné.
-
Choisissez Créer un jeu de paramètres.
-
Note
Vous ne pouvez ajouter que 10 ensembles de paramètres au DefaultDataWarehouse plan.
Une fois que vous avez activé le SageMaker plan Amazon dans votre AWS compte, vous pouvez ajouter des ensembles de paramètres à la configuration du plan. Un ensemble de paramètres est un groupe de clés et de valeurs, requis pour DataZone qu'Amazon puisse établir une connexion avec votre Amazon SageMaker et utilisé pour créer des environnements Sagemaker.
Ajouter des ensembles de paramètres au SageMaker plan Amazon
-
Accédez à la DataZone console Amazon à l'adresse https://console.aws.amazon.com/datazone
et connectez-vous à l'aide des informations d'identification de votre compte. -
Choisissez Afficher les domaines, puis choisissez le domaine contenant le plan activé dans lequel vous souhaitez ajouter le jeu de paramètres.
-
Choisissez l'onglet Blueprints, puis choisissez le SageMaker plan Amazon pour ouvrir la page de détails du plan.
-
Sous l'onglet Ensembles de paramètres de la page de détails du plan, choisissez Créer un jeu de paramètres, puis spécifiez les éléments suivants :
-
Entrez un nom pour le jeu de paramètres.
-
Vous pouvez éventuellement fournir une description pour le jeu de paramètres.
-
Spécifiez le type d'authentification SageMaker du domaine Amazon. Vous pouvez choisir IAM ou IAM Identity Center (SSO).
-
Spécifiez une AWS région.
-
Spécifiez une clé AWS KMS pour le chiffrement des données. Vous pouvez choisir une clé existante ou en créer une nouvelle.
-
Sous Paramètres d'environnement, spécifiez les éléments suivants :
-
ID VPC : ID que vous utilisez pour le VPC de l'environnement Amazon. SageMaker Vous pouvez spécifier un VPC existant ou en créer un nouveau.
-
Sous-réseaux : un ou plusieurs IDs pour une plage d'adresses IP pour des ressources spécifiques au sein de votre VPC.
-
Accès au réseau : choisissez VPC uniquement ou Internet public uniquement.
-
Groupe de sécurité : groupe de sécurité à utiliser lors de la configuration du VPC et des sous-réseaux.
-
-
Sous Paramètres de la source de données, sélectionnez l'une des options suivantes :
-
AWS Glue uniquement
-
AWS Glue + Amazon Redshift sans serveur. Si vous choisissez cette option, spécifiez les éléments suivants :
-
Spécifiez l'ARN AWS secret qui contient les informations d'identification du cluster Amazon Redshift sélectionné. Le AWS secret doit être étiqueté avec le
AmazonDataZoneDomain : [Domain_ID]
tag afin de pouvoir être utilisé dans un ensemble de paramètres.Si vous n'avez pas de AWS secret existant, vous pouvez également en créer un nouveau en choisissant Créer un nouveau AWS secret. Cela ouvre une boîte de dialogue dans laquelle vous pouvez fournir le nom du secret, le nom d'utilisateur et le mot de passe. Une fois que vous avez choisi Create New AWS Secret, Amazon DataZone crée un nouveau secret dans le service AWS Secrets Manager et s'assure que le secret est étiqueté avec le domaine dans lequel vous essayez de créer le jeu de paramètres.
-
Spécifiez le groupe de travail Amazon Redshift que vous souhaitez utiliser lors de la création d'environnements.
-
Spécifiez le nom de la base de données (au sein du groupe de travail que vous avez choisi) que vous souhaitez utiliser lors de la création d'environnements.
-
-
AWS Glue uniquement + Amazon Redshift Cluster
-
Spécifiez l'ARN AWS secret qui contient les informations d'identification du cluster Amazon Redshift sélectionné. Le AWS secret doit être étiqueté avec le
AmazonDataZoneDomain : [Domain_ID]
tag afin de pouvoir être utilisé dans un ensemble de paramètres.Si vous n'avez pas de AWS secret existant, vous pouvez également en créer un nouveau en choisissant Créer un nouveau AWS secret. Cela ouvre une boîte de dialogue dans laquelle vous pouvez fournir le nom du secret, le nom d'utilisateur et le mot de passe. Une fois que vous avez choisi Create New AWS Secret, Amazon DataZone crée un nouveau secret dans le service AWS Secrets Manager et s'assure que le secret est étiqueté avec le domaine dans lequel vous essayez de créer le jeu de paramètres.
-
Spécifiez le cluster Amazon Redshift que vous souhaitez utiliser lors de la création d'environnements.
-
Spécifiez le nom de la base de données (au sein du cluster que vous avez choisi) que vous souhaitez utiliser lors de la création d'environnements.
-
-
-
-
Choisissez Créer un jeu de paramètres.
Ajoutez Amazon SageMaker en tant que service de confiance dans le AWS compte propriétaire du DataZone domaine Amazon
Si vous avez activé le SageMaker plan Amazon, vous devez également l'ajouter SageMaker comme l'un des services fiables d'Amazon DataZone. Pour ce faire, suivez la procédure suivante :
-
Accédez à la DataZone console Amazon à l'adresse https://console.aws.amazon.com/datazone
et connectez-vous à l'aide des informations d'identification de votre compte. -
Choisissez Afficher les domaines, puis choisissez le domaine qui contient le SageMaker plan activé.
-
Choisissez les services fiables, puis Amazon SageMaker, puis sélectionnez Activer.