Établissez l'accès et les autorisations pour les référentiels Git - Amazon EMR

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Établissez l'accès et les autorisations pour les référentiels Git

EMRStudio prend en charge les services Git suivants :

Pour permettre aux utilisateurs de EMR Studio d'associer un référentiel Git à un espace de travail, configurez les exigences d'accès et d'autorisation suivantes. Vous pouvez également configurer des référentiels Git que vous hébergez sur un réseau privé en suivant les instructions de Configuration d'un dépôt Git hébergé en privé pour EMR Studio.

Accès Internet en cluster

Les EMR clusters Amazon exécutés sur Amazon EC2 et Amazon EMR sur des EKS clusters attachés à Studio Workspaces doivent se trouver dans un sous-réseau privé qui utilise une passerelle de traduction d'adresses réseau (NAT), ou ils doivent être en mesure d'accéder à Internet via une passerelle privée virtuelle. Pour de plus amples informations, veuillez consulter VPCOptions Amazon.

Les groupes de sécurité que vous utilisez avec EMR Studio doivent également inclure une règle sortante qui permet à Workspaces d'acheminer le trafic vers Internet à partir d'un cluster rattachéEMR. Pour de plus amples informations, veuillez consulter Définissez des groupes de sécurité pour contrôler le trafic réseau de EMR Studio.

Important

Si l'interface réseau se trouve dans un sous-réseau public, elle ne pourra pas communiquer avec Internet via une passerelle Internet (IGW).

Autorisations pour AWS Secrets Manager

Pour permettre aux utilisateurs de EMR Studio d'accéder aux référentiels Git contenant des secrets AWS Secrets Manager, ajoutez une politique d'autorisation au rôle de service de EMR Studio qui autorise l'secretsmanager:GetSecretValueopération.

Pour plus d'informations sur la façon de lier des référentiels Git à des Workspaces, consultez. Lier des référentiels basés sur Git à un espace de travail Studio EMR

Configuration d'un dépôt Git hébergé en privé pour EMR Studio

Suivez les instructions suivantes pour configurer des référentiels hébergés en privé pour Amazon EMR Studio. Fournissez un fichier de configuration contenant des informations sur vos serveurs DNS et ceux de Git. EMRStudio utilise ces informations pour configurer des espaces de travail qui peuvent acheminer le trafic vers vos référentiels autogérés.

Note

Si vous configurezDnsServerIpV4, EMR Studio utilise votre DNS serveur pour résoudre à la fois votre point de terminaison GitServerDnsName et celui de votre point de EMR terminaison Amazon, par exempleelasticmapreduce.us-east-1.amazonaws.com. Pour configurer un point de terminaison pour AmazonEMR, connectez-vous à votre point de terminaison via VPC celui que vous utilisez avec votre Studio. Cela garantit que le point de EMR terminaison Amazon est résolu vers une adresse IP privée. Pour de plus amples informations, veuillez consulter Connectez-vous à Amazon à EMR l'aide d'un point de VPC terminaison d'interface.

Prérequis

Avant de configurer un dépôt Git hébergé en privé pour EMR Studio, vous avez besoin d'un emplacement de stockage Amazon S3 où EMR Studio peut sauvegarder les espaces de travail et les fichiers de bloc-notes qu'il contient. Utilisez le même compartiment S3 que celui que vous avez spécifié lorsque vous créez un studio.

Pour configurer un ou plusieurs référentiels Git hébergés en privé pour Studio EMR
  1. Créez un fichier de configuration à l'aide du modèle suivant. Incluez les valeurs suivantes pour chaque serveur Git que vous souhaitez spécifier dans votre configuration :

    • DnsServerIpV4- L'IPv4adresse de votre DNS serveur. Si vous fournissez des valeurs pour les deux DnsServerIpV4 etGitServerIpV4List, la valeur de DnsServerIpV4 est prioritaire et EMR Studio l'utilise DnsServerIpV4 pour résoudre votre GitServerDnsName problème.

      Note

      Pour utiliser des référentiels Git hébergés en privé, votre DNS serveur doit autoriser l'accès entrant depuis EMR Studio. Nous vous conseillons vivement de protéger votre DNS serveur contre tout autre accès non autorisé.

    • GitServerDnsName- Le DNS nom de votre serveur Git. Par exemple, "git.example.com".

    • GitServerIpV4List- Une liste d'IPv4adresses appartenant à vos serveurs Git.

    [ { "Type": "PrivatelyHostedGitConfig", "Value": [ { "DnsServerIpV4": "<10.24.34.xxx>", "GitServerDnsName": "<enterprise.git.com>", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>", "<xxx.xxx.xxx.xxx>" ] }, { "DnsServerIpV4": "<10.24.34.xxx>", "GitServerDnsName": "<git.example.com>", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>", "<xxx.xxx.xxx.xxx>" ] } ] } ]
  2. Enregistrez votre fichier de configuration sous configuration.json.

  3. Chargez le fichier de configuration dans l'emplacement de stockage Amazon S3 dans un dossier appelé life-cycle-configuration. Par exemple, si votre emplacement S3 par défaut est s3://DOC-EXAMPLE-BUCKET/studios, votre fichier de configuration doit se trouver dans s3://DOC-EXAMPLE-BUCKET/studios/life-cycle-configuration/configuration.json.

    Important

    Nous vous conseillons vivement de limiter l'accès à votre life-cycle-configuration dossier aux administrateurs de Studio et à votre rôle de service EMR Studio, et de vous protéger configuration.json contre tout accès non autorisé. Pour des instructions, consultez la rubrique Contrôle de l'accès à un compartiment avec des politiques utilisateur ou Bonnes pratiques de sécurité pour Amazon S3.

    Pour des instructions sur le chargement, consultez les rubriques Création d'un dossier et Chargement d'objets dans le Guide de l'utilisateur d'Amazon Simple Storage Service. Pour appliquer votre configuration à un Workspace existant, fermez et redémarrez le Workspace après avoir chargé votre fichier de configuration sur Amazon S3.