EMR Studio を作成する - Amazon EMR

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

EMR Studio を作成する

Amazon EMRコンソールまたは を使用して、チームの EMR Studio を作成できます AWS CLI。Studio インスタンスの作成は、Amazon EMR Studio の設定の一部です。

前提条件

Studio を作成する前に、「Amazon EMR Studio のセットアップ」の前のタスクを完了していることを確認してください。

を使用して Studio を作成するには AWS CLI、最新バージョンがインストールされている必要があります。詳細については、「Installing or updating the latest version of the AWS CLI」を参照してください。

重要

Studio を作成する前に、ブラウザ SwitchyOmega で FoxyProxy や などのプロキシ管理ツールを無効にします。アクティブなプロキシを使用している場合、[Create Studio] (Studio の作成) を選択すると、[Network Failure] (ネットワーク障害) エラーメッセージが表示されることがあります。

Amazon EMRでは、Studio を作成するシンプルなコンソールエクスペリエンスが提供されるため、デフォルト設定をすばやく開始できます。 は、デフォルト設定でインタラクティブなワークロードまたはバッチジョブを実行します。EMR Studio を作成すると、インタラクティブジョブ用の EMR Serverless アプリケーションも作成されます。

Studio の設定を完全に制御する場合は、カスタム を選択できます。これにより、すべての追加設定を設定できます。

Interactive workloads
インタラクティブワークロード用の EMR Studio を作成するには
  1. https://console.aws.amazon.com/emr で Amazon EMRコンソールを開きます。

  2. 左側のナビゲーションの EMR Studio で、開始方法 を選択します。[Studios] ページから新しい Studio を作成することもできます。

  3. インタラクティブワークロード用の EMR Studio を作成する場合、Amazon はデフォルト設定EMRを提供しますが、これらの設定は編集できます。設定可能な設定には、EMRStudio の名前、Workspace の S3 の場所、使用するサービスロール、使用する Workspace (EMRServerless アプリケーション名)、および関連するランタイムロールが含まれます。

  4. Studio の作成 を選択し、Workspace を起動して Studio ページを終了します。新しい Studio が、Studio 名 作成日 Studio アクセス URLなどの詳細とともにリストに表示されます。Workspace がブラウザの新しいタブで開きます。

Batch jobs
インタラクティブワークロード用の EMR Studio を作成するには
  1. https://console.aws.amazon.com/emr で Amazon EMRコンソールを開きます。

  2. 左側のナビゲーションの EMR Studio で、開始方法 を選択します。[Studios] ページから新しい Studio を作成することもできます。

  3. バッチジョブ用の EMR Studio を作成する場合、Amazon はデフォルト設定EMRを提供しますが、これらの設定は編集できます。設定可能な設定には、EMRStudio の名前、EMRサーバーレスアプリケーション名、および関連するランタイムロールが含まれます。

  4. Studio の作成 を選択し、Workspace を起動してスタジオページを終了し、移動します。新しい Studio が、Studio 名 作成日 Studio アクセス URLなどの詳細とともにリストに表示されます。EMR Studio がブラウザの新しいタブで開きます。

Custom settings
カスタム設定で EMR Studio を作成するには
  1. https://console.aws.amazon.com/emr で Amazon EMRコンソールを開きます。

  2. 左側のナビゲーションの EMR Studio で、開始方法 を選択します。[Studios] ページから新しい Studio を作成することもできます。

  3. [Studio を作成] を選択して、[Studio を作成] ページを開きます。

  4. Studio 名 を入力します。

  5. 新しい S3 バケットを作成するか、既存の場所を使用するかを選択します。

  6. Studio に追加する Workspace を選択します。最大 3 つの Workspace を追加できます。

  7. [Authentication] (認証) で、Studio の認証モードを選択し、次の表に従って情報を入力します。EMR Studio の認証の詳細については、「」を参照してくださいAmazon EMR Studio の認証モードを選択する

    使用するもの 手順
    IAM 認証またはフェデレーション

    デフォルトの認証方法は AWS Identity and Access Management (IAM) です。ユーザーまたはグループを EMR Studio に割り当てる で説明されているように、特定のユーザーに Studio へのアクセスを許可するタグを追加することもできます。

    Studio URLと ID プロバイダー (IdP ) の認証情報を使用してフェデレーティッドユーザーにログインする場合は、ドロップダウンリストから IdP を選択し、ID プロバイダー (IdP ) のログインURL名とRelayStateパラメータ名を入力します。

    IdP 認証URLsと RelayState 名前のリストについては、「」を参照してくださいID プロバイダーの RelayState パラメータと認証 URLs

    IAM Identity Center 認証

    EMR Studio サービスロールユーザーロール を選択します。詳細については、「EMR Studio サービスロールを作成する」および「IAM Identity Center 認証モード用の EMR Studio ユーザーロールを作成する」を参照してください。

    Studio で IAM Identity Center (旧 AWS Single Sign On) 認証を使用する場合、信頼できる ID の伝播を有効にするオプションを使用して、ユーザーのサインオンエクスペリエンスを効率化できます。信頼できる ID の伝播を使用すると、ユーザーは Identity Center 認証情報を使用してログインし、Studio を使用するときに ID をダウンストリーム AWS サービスに伝播させることができます。

    [アプリケーションアクセス] セクションでは、Identity Center 内のすべてのユーザーとグループが Studio にアクセスできるようにするか、または選択した割り当てられたユーザーとグループのみが Studio にアクセスできるようにするかを指定することもできます。

    詳細については、「」およびAmazon EMRを と統合する AWS IAM Identity Center「 Identity AWS IAM Center ユーザーガイド」の「アプリケーション間での信頼できる ID の伝播」を参照してください。 https://docs.aws.amazon.com/singlesignon/latest/userguide/trustedidentitypropagation.html

  8. ではVPC、ドロップダウンリストから Studio の Amazon Virtual Private Cloud (VPC) を選択します。

  9. サブネット で、Studio VPCに関連付けるサブネットを最大 5 つ選択します。Studio を作成した後に、さらにサブネットを追加することもできます。

  10. [Security groups] (セキュリティグループ) で、デフォルトのセキュリティグループまたはカスタムセキュリティグループのいずれかを選択します。詳細については、「EMR Studio ネットワークトラフィックを制御するセキュリティグループを定義する」を参照してください。

    選択内容 手順
    デフォルトの EMR Studio セキュリティグループ

    Studio で Git ベースのリポジトリリンクを有効にするには、[Enable clusters/endpoints and Git repository] (クラスター/エンドポイントと Git リポジトリを有効にする) を選択します。それ以外の場合は、[Enable clusters/endpoints] (クラスタ/エンドポイントを有効にする) を選択します。

    Studio のカスタムセキュリティグループ
    • [Cluster/endpoint security group] (クラスタ/エンドポイントセキュリティグループ) で、設定したエンジンセキュリティグループをドロップダウンリストから選択します。Studio は、このセキュリティグループを使用して、アタッチされた Workspace からのインバウンドアクセスを許可します。

    • [Workspace security group] (Workspace セキュリティグループ) で、設定した Workspace セキュリティグループをドロップダウンリストから選択します。Studio は、Workspaces でこのセキュリティグループを使用して、アタッチされた Amazon EMRクラスターとパブリックにホストされている Git リポジトリへのアウトバウンドアクセスを提供します。

  11. Studio およびその他のリソースにタグを追加します。タグの詳細については、「タグクラスター」を参照してください。

  12. Studio の作成 を選択し、Workspace を起動してスタジオページを終了し、移動します。新しい Studio が、Studio 名 作成日 Studio アクセス URLなどの詳細とともにリストに表示されます。

Studio を作成したら、「ユーザーまたはグループを EMR Studio に割り当てる」の手順に従います。

CLI
注記

読みやすくするために、Linux 行連続文字 (\) が含まれています。Linux コマンドでは、これらは削除することも、使用することもできます。Windows の場合、削除するか、キャレット (^) に置き換えてください。

例 – 認証IAMに を使用する EMR Studio を作成する

次の AWS CLI コマンド例では、IAM認証モードで EMR Studio を作成します。Studio でIAM認証またはフェデレーションを使用する場合、 は指定しません--user-role

フェデレーティッドユーザーが Studio URLと ID プロバイダー (IdP) の認証情報を使用してログインできるようにするには、 --idp-auth-urlと を指定します--idp-relay-state-parameter-name。IdP 認証URLsと RelayState 名前のリストについては、「」を参照してくださいID プロバイダーの RelayState パラメータと認証 URLs

aws emr create-studio \ --name <example-studio-name> \ --auth-mode IAM \ --vpc-id <example-vpc-id> \ --subnet-ids <subnet-id-1> <subnet-id-2>... <subnet-id-5> \ --service-role <example-studio-service-role-name> \ --user-role studio-user-role-name \ --workspace-security-group-id <example-workspace-sg-id> \ --engine-security-group-id <example-engine-sg-id> \ --default-s3-location <example-s3-location> \ --idp-auth-url <https://EXAMPLE/login/> \ --idp-relay-state-parameter-name <example-RelayState>
例 – 認証に Identity Center を使用する EMR Studio を作成する

次のコマンド AWS CLI 例では、IAMIdentity Center 認証モードを使用する EMR Studio を作成します。IAM Identity Center 認証を使用する場合は、 を指定する必要があります--user-role

IAM Identity Center 認証モードの詳細については、「」を参照してくださいAmazon EMR Studio の IAM Identity Center 認証モードを設定する

aws emr create-studio \ --name <example-studio-name> \ --auth-mode SSO \ --vpc-id <example-vpc-id> \ --subnet-ids <subnet-id-1> <subnet-id-2>... <subnet-id-5> \ --service-role <example-studio-service-role-name> \ --user-role <example-studio-user-role-name> \ --workspace-security-group-id <example-workspace-sg-id> \ --engine-security-group-id <example-engine-sg-id> \ --default-s3-location <example-s3-location> --trusted-identity-propagation-enabled \ --idc-user-assignment OPTIONAL \ --idc-instance-arn <iam-identity-center-instance-arn>
例 – のCLI出力 aws emr create-studio

以下に、Studio の作成後に表示される出力の例を示します。

{ StudioId: "es-123XXXXXXXXX", Url: "https://es-123XXXXXXXXX.emrstudio-prod.us-east-1.amazonaws.com" }

create-studio コマンドの詳細については、 「AWS CLI コマンドリファレンス」を参照してください。

ID プロバイダーの RelayState パラメータと認証 URLs

IAM フェデレーションを使用し、ユーザーが Studio URLと ID プロバイダー (IdP ) の認証情報を使用してログインできるようにする場合は、 時に ID プロバイダー (IdP ) のログインURL名とRelayStateパラメータ名を指定できますEMR Studio を作成する

次の表は、一部の一般的な ID プロバイダーの標準認証URLと RelayState パラメータ名を示しています。

ID プロバイダー パラメータ 認証 URL
Auth0 RelayState https://<sub_domain>.auth0.com/samlp/<app_id>
Google アカウント RelayState https://accounts.google.com/o/saml2/initsso?idpid=<idp_id>&spid=<sp_id>&forceauthn=false
Microsoft Azure RelayState https://myapps.microsoft.com/signin/<app_name>/<app_id>?tenantId=<tenant_id>
Okta RelayState https://<sub_domain>.okta.com/app/<app_name>/<app_id>/sso/saml
PingFederate TargetResource https://<host>/idp/<idp_id>/startSSO.ping?PartnerSpId=<sp_id>
PingOne TargetResource https://sso.connect.pingidentity.com/sso/sp/initsso?saasid=<app_id>&idpid=<idp_id>