Git ベースのリポジトリのアクセス権とアクセス許可を設定する - Amazon EMR

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Git ベースのリポジトリのアクセス権とアクセス許可を設定する

EMR Studio は、次の Git ベースのサービスをサポートしています。

EMR Studio ユーザーが Git リポジトリを Workspace に関連付けるには、以下のアクセスとアクセス許可の要件を設定します。「EMR Studio のプライベートホスト Git リポジトリを設定する」の手順に従って、プライベートネットワークでホストしている Git ベースのリポジトリを設定することもできます。

クラスターインターネットアクセス権

Studio Workspaces にアタッチされたEMRクラスターで Amazon EC2と Amazon EMRで実行されている両方の Amazon EKSクラスターは、ネットワークアドレス変換 (NAT) ゲートウェイを使用するプライベートサブネット内にあるか、仮想プライベートゲートウェイを介してインターネットにアクセスできる必要があります。詳細については、「クラスター起動時の Amazon VPCオプション」を参照してください。

EMR Studio で使用するセキュリティグループには、Workspaces がアタッチされたEMRクラスターからインターネットにトラフィックをルーティングできるようにするアウトバウンドルールも含まれている必要があります。詳細については、「EMR Studio ネットワークトラフィックを制御するセキュリティグループを定義する」を参照してください。

重要

ネットワークインターフェイスがパブリックサブネットにある場合、インターネットゲートウェイ () を介してインターネットと通信することはできませんIGW。

のアクセス許可 AWS Secrets Manager

EMR Studio ユーザーが に保存されているシークレットを使用して Git リポジトリにアクセスできるようにするには AWS Secrets Manager、 secretsmanager:GetSecretValueオペレーションを許可するアクセス許可ポリシーを EMR Studio のサービスロールに追加します。

Git ベースのリポジトリを Workspace にリンクする方法については、「Git ベースのリポジトリを EMR Studio Workspace にリンクする」を参照してください。

EMR Studio のプライベートホスト Git リポジトリを設定する

Amazon EMR Studio のプライベートホストリポジトリを設定するには、次の手順に従います。DNS および Git サーバーに関する情報を含む設定ファイルを指定します。EMR Studio はこの情報を使用して、セルフマネージドリポジトリにトラフィックをルーティングできる Workspaces を設定します。

注記

を設定するとDnsServerIpV4、EMRStudio はDNSサーバーを使用して GitServerDnsNameと などの Amazon EMRエンドポイントの両方を解決しますelasticmapreduce.us-east-1.amazonaws.com。Amazon のエンドポイントを設定するにはEMR、Studio VPCで使用している を介してエンドポイントに接続します。これにより、Amazon EMRエンドポイントはプライベート IP に解決されます。詳細については、「インターフェイスVPCエンドポイントEMRを使用して Amazon に接続する」を参照してください。

前提条件

EMR Studio のプライベートホスト Git リポジトリを設定する前に、EMRStudio が Studio で Workspaces とノートブックファイルをバックアップできる Amazon S3 ストレージの場所が必要です。Studio の作成時に指定した S3 バケットと同じ S3 バケットを使用します。

EMR Studio でプライベートにホストされる 1 つ以上の Git リポジトリを設定するには
  1. 次のテンプレートを使用して、設定ファイルを作成します。設定で指定する Git サーバーごとに次の値を含めます。

    • DnsServerIpV4 - DNSサーバーのIPv4アドレス。DnsServerIpV4 と の両方の値を指定するとGitServerIpV4List、 の値がDnsServerIpV4優先され、EMRStudio が DnsServerIpV4を使用して を解決しますGitServerDnsName

      注記

      プライベートにホストされた Git リポジトリを使用するには、DNSサーバーが EMR Studio からのインバウンドアクセスを許可する必要があります。DNS サーバーを他の不正アクセスから保護することをお勧めします。

    • GitServerDnsName - Git サーバーDNSの名前。例えば、 です"git.example.com"

    • GitServerIpV4List - Git サーバーに属するIPv4アドレスのリスト。

    [ { "Type": "PrivatelyHostedGitConfig", "Value": [ { "DnsServerIpV4": "<10.24.34.xxx>", "GitServerDnsName": "<enterprise.git.com>", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>", "<xxx.xxx.xxx.xxx>" ] }, { "DnsServerIpV4": "<10.24.34.xxx>", "GitServerDnsName": "<git.example.com>", "GitServerIpV4List": [ "<xxx.xxx.xxx.xxx>", "<xxx.xxx.xxx.xxx>" ] } ] } ]
  2. configuration.json という名前で設定ファイルを保存します。

  3. 設定ファイルを Amazon S3 ストレージの場所にある life-cycle-configuration というフォルダーにアップロードします。例えば、デフォルトの S3 の場所が s3://amzn-s3-demo-bucket/studios の場合、設定ファイルは s3://amzn-s3-demo-bucket/studios/life-cycle-configuration/configuration.json に配置します。

    重要

    life-cycle-configuration フォルダへのアクセスを Studio 管理者と EMR Studio サービスロールに制限し、不正アクセスconfiguration.jsonから保護することをお勧めします。手順については、「ユーザーポリシーを使用したバケットへのアクセスの制御」または「Amazon S3 のセキュリティベストプラクティス」を参照してください。

    アップロードの手順については、「Amazon Simple Storage Service ユーザーガイド」の「フォルダの作成」と「オブジェクトのアップロード」を参照してください。設定を既存の Workspace に適用するには、設定ファイルを Amazon S3 にアップロードした後、Workspace を閉じて再起動します。