Lier des référentiels basés sur Git à un espace de travail Studio EMR - Amazon EMR

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Lier des référentiels basés sur Git à un espace de travail Studio EMR

À propos des référentiels Git pour Studio EMR

Vous pouvez associer un maximum de trois référentiels Git à un espace de travail EMR Studio. Par défaut, chaque espace de travail vous permet de choisir parmi une liste de référentiels Git associés au même AWS compte que le Studio. Vous pouvez également créer un nouveau référentiel Git en tant que ressource pour un Workspace.

Vous pouvez exécuter des commandes Git comme suit à l'aide d'une commande de terminal lorsque vous êtes connecté au nœud primaire d'un cluster.

!git pull origin <branch-name>

Vous pouvez également utiliser l'extension jupyterlab-git. Ouvrez-la depuis la barre latérale gauche en choisissant l'icône Git. Pour plus d'informations sur l'extension jupyterlab-git pour, consultez jupyterlab-git. JupyterLab

Prérequis

Pour lier un référentiel Git rattaché à un Workspace
  1. Ouvrez le Workspace que vous souhaitez lier à un référentiel depuis la liste Workspaces du studio.

  2. Dans la barre latérale gauche, choisissez l'icône du référentiel Amazon EMR Git pour ouvrir le panneau d'outils du référentiel Git.

  3. Sous Référentiels Git, développez la liste déroulante et sélectionnez un maximum de trois référentiels à rattacher au Workspace. EMRStudio enregistre votre sélection et commence à lier chaque dépôt.

Le processus de liaison peut prendre un certain temps. Vous pouvez voir l'état de chaque référentiel que vous avez sélectionné dans le panneau d'outils Référentiel Git. Une fois que EMR Studio a lié un référentiel à un espace de travail, les fichiers appartenant à ce référentiel devraient apparaître dans le panneau du navigateur de fichiers.

Ajouter un nouveau référentiel Git à un Workspace en tant que ressource
  1. Ouvrez le Workspace que vous souhaitez lier à un référentiel depuis la liste Workspaces de votre studio.

  2. Dans la barre latérale gauche, choisissez l'icône du référentiel Amazon EMR Git pour ouvrir le panneau d'outils du référentiel Git.

  3. Choisissez Ajouter un nouveau référentiel Git.

  4. Pour Nom du référentiel, entrez un nom descriptif pour le référentiel dans EMR Studio. Les noms ne peuvent contenir que des caractères alphanumériques, des traits d'union ou des traits de soulignement.

  5. Pour le dépôt Git URL, entrez URL le nom du dépôt. Lorsque vous utilisez un CodeCommit dépôt, c'est celui-ci URL qui est copié lorsque vous choisissez Cloner URL puis Cloner HTTPS. Par exemple, https://git-codecommit.us-west-2.amazonaws.com/v1/repos/[MyCodeCommitRepoName].

  6. Pour Branche, entrez le nom d'une branche existante que vous souhaitez récupérer.

  7. Pour les informations d'identification Git, choisissez une option selon les instructions suivantes. EMRStudio accède à vos informations d'identification Git à l'aide des secrets stockés dans Secrets Manager.

    Note

    Si vous utilisez un GitHub référentiel, nous vous recommandons d'utiliser un jeton d'accès personnel (PAT) pour vous authentifier. À compter du 13 août 2021, une authentification basée sur des jetons GitHub sera requise et les mots de passe ne seront plus acceptés lors de l'authentification des opérations Git. Pour plus d'informations, consultez l'article sur les exigences d'authentification par jeton pour les opérations Git dans The GitHub Blog.

    Option Description
    Création d'un secret

    Choisissez cette option pour associer les informations d'identification Git existantes à un nouveau secret qui sera créé AWS Secrets Manager pour vous. Effectuez l'une des opérations suivantes en fonction des informations d'identification Git que vous utilisez pour le référentiel.

    Si vous utilisez un nom d'utilisateur et un mot de passe Git pour accéder au référentiel, sélectionnez Nom d'utilisateur et mot de passe, entrez le nom secret à utiliser dans Secrets Manager, puis indiquez le nom d'utilisateur et le mot de passe à rattacher au secret.

    – OU –

    Si vous utilisez un jeton d'accès personnel pour accéder au référentiel, sélectionnez Jeton d'accès personnel (PAT), entrez le nom du secret à utiliser dans Secrets Manager, puis entrez votre jeton d'accès personnel. Pour plus d'informations, consultez Création d'un jeton d'accès personnel pour la ligne de commande GitHub et de jetons d'accès personnels pour Bitbucket. CodeCommit les référentiels ne prennent pas en charge cette option.

    Utilisation d'un référentiel public sans informations d'identification Choisissez cette option pour accéder à un référentiel public.
    Utiliser un AWS secret existant

    Choisissez cette option si vous avez déjà enregistré vos informations d'identification en tant que secret dans Secrets Manager, puis sélectionnez le nom secret dans la liste.

    Si vous sélectionnez un secret rattaché à un nom d'utilisateur et un mot de passe Git, le secret doit être au format {"gitUsername": "MyUserName", "gitPassword": "MyPassword"}.

  8. Choisissez Ajouter un référentiel pour créer le nouveau référentiel. Une fois que EMR Studio a créé le nouveau référentiel, vous verrez un message de confirmation. Le nouveau référentiel apparaît dans la liste déroulante des référentiels Git.

  9. Pour lier le nouveau référentiel à votre Workspace, sélectionnez-le dans la liste déroulante située sous Référentiels Git.

Le processus de liaison peut prendre un certain temps. Une fois que EMR Studio a lié le nouveau référentiel à l'espace de travail, un nouveau dossier portant le même nom que votre référentiel devrait apparaître dans le panneau du navigateur de fichiers.

Pour ouvrir un autre référentiel lié, accédez au dossier correspondant dans le navigateur de fichiers.