EMR Studio Workspace にコンピューティングをアタッチする - Amazon EMR

EMR Studio Workspace にコンピューティングをアタッチする

Amazon EMR Studio は、EMR クラスターのカーネルを使用してノートブックコマンドを実行します。カーネルを選択する前に、Amazon EC2 インスタンスを使用するクラスター、Amazon EMR on EKS クラスター、または EMR Serverless アプリケーションに Workspace をアタッチする必要があります。EMR Studio では、Workspace を新規または既存のクラスターにアタッチでき、Workspace を閉じずにクラスターを柔軟に変更できます。

Amazon EC2 クラスターを EMR Studio Workspace にアタッチする

Workspace の作成時に Amazon EC2 で実行されている EMR クラスターを Workspace にアタッチするか、既存の Workspace にクラスターをアタッチできます。新しいクラスターを作成してアタッチする場合は、「新しい EMR クラスターを作成して EMR Studio Workspace にアタッチする」を参照してください。

注記

IAM Identity Center の信頼できる ID 伝達が有効になっている Studio のワークスペースは、Identity Center が有効になっているセキュリティ設定の EMR クラスターにのみ接続できます。

On create
Workspace の作成時に Amazon EMR コンピューティングクラスターをアタッチする
  1. [Create a Workspace] (Workspace の作成) ダイアログボックスで、新しい Workspace のサブネットが既に選択されていることを確認します。[Advanced configuration] (高度な設定) セクションを展開します。

  2. [Attach Workspace to an EMR cluster] (EMR クラスターへの Workspace のアタッチ) を選択します。

  3. [EMR クラスター] ドロップダウンリストで、既存の EMR クラスターを選択して Workspace にアタッチします。

クラスターをアタッチしたら、Workspace の作成を完了します。新しい Workspace を初めて開き、[EMR クラスター] パネルを選択すると、選択したクラスターがアタッチされていることがわかります。

On launch
Workspace の起動時に Amazon EMR コンピューティングクラスターにアタッチする
  1. Workspace のリストに移動し、起動する Workspace の行を選択します。次に、[Workspace を起動] > [オプションを使用して起動する] を選択します。

  2. Workspace にアタッチする EMR クラスターを選択します。

クラスターをアタッチしたら、Workspace の作成を完了します。新しい Workspace を初めて開き、[EMR クラスター] パネルを選択すると、選択したクラスターがアタッチされていることがわかります。

In JupyterLab
JupyterLab で Workspace を Amazon EMR コンピューティングクラスターにアタッチする
  1. Workspace を選択し、[Workspace を起動] > [クイック起動] を選択します。

  2. JupyterLab 内で、左側のサイドバーにある [クラスター] タブを開きます。

  3. [EMR on EC2 クラスター] ドロップダウンを選択するか、Amazon EMR on EKS クラスターを選択します。

  4. [アタッチ] を選択して、クラスターを Workspace にアタッチします。

クラスターをアタッチしたら、Workspace の作成を完了します。新しい Workspace を初めて開き、[EMR クラスター] パネルを選択すると、選択したクラスターがアタッチされていることがわかります。

In the Workspace UI
Workspace ユーザーインターフェイスから Workspace を Amazon EMR コンピューティングクラスターにアタッチする
  1. クラスターにアタッチする Workspace で、左側のサイドバーから [EMR クラスター] アイコンを選択して、[クラスター] パネルを開きます。

  2. [クラスターのタイプ] でドロップダウンを展開し、[EC2 上の EMR クラスター] を選択します。

  3. ドロップダウンリストからクラスターを選択します。クラスター選択ドロップダウンリストを有効にするには、まず既存のクラスターをデタッチする必要がある場合があります。

  4. 添付を選択します。クラスターがアタッチされると、成功メッセージが表示されます。

Amazon EMR on EKS クラスターを EMR Studio Workspace にアタッチする

Amazon EC2 で実行されている Amazon EMR クラスターを使用するだけでなく、Workspace を Amazon EMR on EKS クラスターにアタッチしてノートブックコードを実行することもできます。Amazon EMR on EKS の詳細については、「Amazon EMR on EKS とは」を参照してください。

Workspace を Amazon EMR on EKS クラスターに接続する前に、Studio 管理者からアクセス許可を付与してもらう必要があります。

注記

IAM Identity Center の信頼できる ID 伝達を使用する EMR Studio では、EKS クラスターで Amazon EMR を起動することはできません。

On create
Workspace の作成時に Amazon EMR on EKS クラスターをアタッチするには
  1. [Create a Workspace] (Workspace の作成) ダイアログボックスで、[Advanced configuration] (高度な設定) セクションを展開します。

  2. [Amazon EMR on EKS クラスターへの Workspace のアタッチ] を選択します。

  3. [Amazon EMR on EKS クラスター] で、ドロップダウンリストからクラスターを選択します。

  4. [Select an endpoint] (エンドポイントの選択) で、Workspace にアタッチするマネージドエンドポイントを選択します。マネージドエンドポイントは、選択したクラスターと EMR Studio が通信できるようにするゲートウェイです。

  5. [Workspace の作成] を選択して、Workspace の作成プロセスを完了し、選択したクラスターをアタッチします。

クラスターをアタッチしたら、Workspace の作成プロセスを完了できます。新しい Workspace を初めて開き、[EMR クラスター] パネルを選択すると、選択したクラスターがアタッチされていることがわかります。

In the Workspace UI
Workspace ユーザーインターフェイスから Amazon EMR on EKS クラスターをアタッチするには
  1. クラスターにアタッチする Workspace で、左側のサイドバーから [EMR クラスター] アイコンを選択して、[クラスター] パネルを開きます。

  2. [クラスターのタイプ] ドロップダウンを展開し、[EKS 上の EMR クラスター] を選択します。

  3. [EKS 上の EMR クラスター] で、ドロップダウンリストからクラスターを選択します。

  4. [Endpoint] (エンドポイント) で、Workspace にアタッチするマネージドエンドポイントを選択します。マネージドエンドポイントは、選択したクラスターと EMR Studio が通信できるようにするゲートウェイです。

  5. 添付を選択します。クラスターがアタッチされると、成功メッセージが表示されます。

Amazon EMR Serverless アプリケーションを EMR Studio Workspace にアタッチする

Workspace を EMR Serverless アプリケーションにアタッチして、インタラクティブなワークロードを実行できます。詳細については、「Using notebooks to run interactive workloads with EMR Serverless through EMR Studio」を参照してください。

注記

IAM Identity Center の信頼できる ID 伝達を使用する EMR Studio に、EMR Serverless アプリケーションをアタッチすることはできません。

例 JupyterLab で EMR Serverless アプリケーションに Workspace をアタッチする

Workspace を EMR Serverless アプリケーションに接続する前に、アカウント管理者に「Required permissions for interactive workloads」で説明しているアクセス許可を付与してもらう必要があります。

  1. EMR Studio に移動して Workspace を選択し、[Workspace を起動] > [クイック起動] を選択します。

  2. JupyterLab 内で、左側のサイドバーにある [クラスター] タブを開きます。

  3. コンピューティングオプションとして [EMR Serverless] を選択し、EMR Serverless アプリケーションとランタイムロールを選択します。

  4. クラスターを Workspace にアタッチするには、[アタッチ] を選択します。

対象の Workspace を開くと、選択したアプリケーションがアタッチされていることが確認できます。

新しい EMR クラスターを作成して EMR Studio Workspace にアタッチする

上級 EMR Studio ユーザーは、Amazon EC2 で実行されている新しい EMR クラスターを Workspace で使用するためにプロビジョニングできます。新しいクラスターには、EMR Studio に必要なすべてのビッグデータアプリケーションがデフォルトでインストールされています。

クラスターを作成するには、Studio 管理者から、セッションポリシーを使用してアクセス許可を付与してもらう必要があります。詳細については、「EMR Studio ユーザーのアクセス許可ポリシーの作成」を参照してください。

[Create a Workspace] (Workspace の作成) ダイアログボックスまたは [Cluster] (クラスター) パネル (Workspace UI) で、新しいクラスターを作成できます。いずれの方法でも、次の 2 つのクラスター作成オプションがあります。

  1. [Create an EMR cluster] (EMR クラスターを作成) - Amazon EC2 インスタンスタイプとカウントを選択して EMR クラスターを作成します。

  2. [Use a cluster template] (クラスターテンプレートの使用) - 事前定義されたクラスタテンプレートを選択して、クラスターをプロビジョニングします。このオプションは、クラスターテンプレートを使用するアクセス許可がある場合に表示されます。

    注記

    Studio 用の IAM Identity Center で信頼できる ID 伝達を有効にした場合は、テンプレートを使用してクラスターを作成する必要があります。

クラスター設定を提供して EMR クラスターを作成するには
  1. 開始点を選択します。

    実行方法 手順
    [Create a Workspace] (Workspace の作成) ダイアログボックスを使用して Workspace を作成するときにクラスターを作成する。 [Create a Workspace] (Workspace の作成) ダイアログボックスで [Advanced configuration] (高度な設定) セクションを展開し、[Create an EMR cluster] (EMR クラスターを作成) を選択します。
    Workspace を作成した後に Workspace UI の [EMR クラスター] パネルからクラスターを作成する。 開いている Workspace の左側のサイドバーにある [EMR クラスター] タブで、[高度な設定] セクションを展開し、[クラスターの作成] を選択します。
  2. [Cluster name] (クラスター名) を入力します。クラスターに名前を付けると、後から EMR Studio クラスターリストでそのクラスターを見つけるのに役立ちます。

  3. [Amazon EMR リリース] で、クラスターの Amazon EMR リリースバージョンを選択します。

  4. [Instance] (インスタンス) で、クラスターの Amazon EC2 インスタンスのタイプと数を選択します。インスタンスタイプの選択の詳細については、「Amazon EMR で使用するために Amazon EC2 インスタンスを設定する」を参照してください。1 つのインスタンスがプライマリノードとして使用されます。

  5. EMR Studio が新しいクラスターを起動できる [Subnet] (サブネット) を選択します。各サブネットオプションは Studio 管理者によって事前承認され、Workspace はリストされたサブネット内のクラスターに接続できる必要があります。

  6. [S3 URI for log storage] (ログストレージの S3 URI) を選択します。

  7. [Create EMR cluster] (EMR クラスターの作成) を選択して、クラスターをプロビジョニングします。[Workspace の作成] ダイアログボックスを使用する場合、[Workspace の作成] を選択して、Workspace を作成し、クラスターをプロビジョニングします。EMR Studio は新しいクラスターをプロビジョニングした後に、クラスターを Workspace にアタッチします。

クラスターテンプレートを使用してクラスターを作成するには
  1. 開始点を選択します。

    実行方法 手順
    [Create a Workspace] (Workspace の作成) ダイアログボックスを使用して Workspace を作成するときにクラスターを作成する。 [Create a Workspace] (Workspace の作成) ダイアログボックスで [Advanced configuration] (高度な設定) セクションを展開し、[Use a cluster template] (クラスターテンプレートの使用) を選択します。
    Workspace UI の [EMR クラスター] パネルからクラスターを作成する。 開いている Workspace の左側のサイドバーにある [EMR クラスター] タブで、[高度な設定] セクションを展開し、[クラスターテンプレート] を選択します。
  2. ドロップダウンリストからクラスターテンプレートを選択します。使用可能な各クラスタテンプレートには、選択に役立つ簡単な説明が含まれています。

  3. 選択したクラスターテンプレートには、Amazon EMR リリースバージョンやクラスター名などの追加のパラメーターが含まれる場合があります。値を選択または挿入するか、管理者が選択したデフォルト値を使用できます。

  4. EMR Studio が新しいクラスターを起動できる [Subnet] (サブネット) を選択します。各サブネットオプションは Studio 管理者によって事前承認され、Workspace はサブネット内のクラスターに接続できる必要があります。

  5. [Use cluster template] (クラスターテンプレートの使用) を選択して、クラスターをプロビジョニングし、Workspace にアタッチします。EMR Studio がクラスターを作成するまでに数分かかります。[Workspace の作成] ダイアログボックスを使用する場合、[Workspace の作成] を選択して、Workspace を作成し、クラスターをプロビジョニングします。EMR Studio は新しいクラスターをプロビジョニングした後に、クラスターを Workspace にアタッチします。

EMR Studio Workspace からコンピューティングをデタッチする

Workspace にアタッチされているクラスターを交換するには、Workspace UI からクラスターをデタッチします。

Workspace からクラスターをデタッチするには
  1. クラスターからデタッチする Workspace で、左側のサイドバーから [EMR クラスター] アイコンを選択して、[クラスター] パネルを開きます。

  2. [Select cluster] (クラスターの選択) で [Detach] (デタッチ) を選択し、EMR Studio によってクラスターがデタッチされるまで待ちます。クラスターがデタッチされると、成功メッセージが表示されます。

EMR Serverless アプリケーションを EMR Studio Workspace からデタッチするには

Workspace にアタッチされているコンピューティングを交換するには、Workspace UI からアプリケーションをデタッチします。

  1. クラスターからデタッチする Workspace で、左側のサイドバーから [Amazon EMR コンピューティング] アイコンを選択して、[コンピューティング] パネルを開きます。

  2. [コンピューティングの選択][デタッチ] を選択し、EMR Studio によってアプリケーションがデタッチされるまで待ちます。アプリケーションがデタッチされると、成功メッセージが表示されます。