EMR Studio Workspace にコンピューティングをアタッチする
Amazon EMR Studio は、EMR クラスターのカーネルを使用してノートブックコマンドを実行します。カーネルを選択する前に、Amazon EC2 インスタンスを使用するクラスター、Amazon EMR on EKS クラスター、または EMR Serverless アプリケーションに Workspace をアタッチする必要があります。EMR Studio では、Workspace を新規または既存のクラスターにアタッチでき、Workspace を閉じずにクラスターを柔軟に変更できます。
このセクションでは、EMR Studio のクラスターの操作およびプロビジョニングに役立つ次のトピックについて説明します。
Amazon EC2 クラスターを EMR Studio Workspace にアタッチする
Workspace の作成時に Amazon EC2 で実行されている EMR クラスターを Workspace にアタッチするか、既存の Workspace にクラスターをアタッチできます。新しいクラスターを作成してアタッチする場合は、「新しい EMR クラスターを作成して EMR Studio Workspace にアタッチする」を参照してください。
注記
IAM Identity Center の信頼できる ID 伝達が有効になっている Studio のワークスペースは、Identity Center が有効になっているセキュリティ設定の EMR クラスターにのみ接続できます。
Amazon EMR on EKS クラスターを EMR Studio Workspace にアタッチする
Amazon EC2 で実行されている Amazon EMR クラスターを使用するだけでなく、Workspace を Amazon EMR on EKS クラスターにアタッチしてノートブックコードを実行することもできます。Amazon EMR on EKS の詳細については、「Amazon EMR on EKS とは」を参照してください。
Workspace を Amazon EMR on EKS クラスターに接続する前に、Studio 管理者からアクセス許可を付与してもらう必要があります。
注記
IAM Identity Center の信頼できる ID 伝達を使用する EMR Studio では、EKS クラスターで Amazon EMR を起動することはできません。
Amazon EMR Serverless アプリケーションを EMR Studio Workspace にアタッチする
Workspace を EMR Serverless アプリケーションにアタッチして、インタラクティブなワークロードを実行できます。詳細については、「Using notebooks to run interactive workloads with EMR Serverless through EMR Studio」を参照してください。
注記
IAM Identity Center の信頼できる ID 伝達を使用する EMR Studio に、EMR Serverless アプリケーションをアタッチすることはできません。
例 JupyterLab で EMR Serverless アプリケーションに Workspace をアタッチする
Workspace を EMR Serverless アプリケーションに接続する前に、アカウント管理者に「Required permissions for interactive workloads」で説明しているアクセス許可を付与してもらう必要があります。
-
EMR Studio に移動して Workspace を選択し、[Workspace を起動] > [クイック起動] を選択します。
-
JupyterLab 内で、左側のサイドバーにある [クラスター] タブを開きます。
-
コンピューティングオプションとして [EMR Serverless] を選択し、EMR Serverless アプリケーションとランタイムロールを選択します。
-
クラスターを Workspace にアタッチするには、[アタッチ] を選択します。
対象の Workspace を開くと、選択したアプリケーションがアタッチされていることが確認できます。
新しい EMR クラスターを作成して EMR Studio Workspace にアタッチする
上級 EMR Studio ユーザーは、Amazon EC2 で実行されている新しい EMR クラスターを Workspace で使用するためにプロビジョニングできます。新しいクラスターには、EMR Studio に必要なすべてのビッグデータアプリケーションがデフォルトでインストールされています。
クラスターを作成するには、Studio 管理者から、セッションポリシーを使用してアクセス許可を付与してもらう必要があります。詳細については、「EMR Studio ユーザーのアクセス許可ポリシーの作成」を参照してください。
[Create a Workspace] (Workspace の作成) ダイアログボックスまたは [Cluster] (クラスター) パネル (Workspace UI) で、新しいクラスターを作成できます。いずれの方法でも、次の 2 つのクラスター作成オプションがあります。
-
[Create an EMR cluster] (EMR クラスターを作成) - Amazon EC2 インスタンスタイプとカウントを選択して EMR クラスターを作成します。
-
[Use a cluster template] (クラスターテンプレートの使用) - 事前定義されたクラスタテンプレートを選択して、クラスターをプロビジョニングします。このオプションは、クラスターテンプレートを使用するアクセス許可がある場合に表示されます。
注記
Studio 用の IAM Identity Center で信頼できる ID 伝達を有効にした場合は、テンプレートを使用してクラスターを作成する必要があります。
クラスター設定を提供して EMR クラスターを作成するには
-
開始点を選択します。
実行方法 手順 [Create a Workspace] (Workspace の作成) ダイアログボックスを使用して Workspace を作成するときにクラスターを作成する。 [Create a Workspace] (Workspace の作成) ダイアログボックスで [Advanced configuration] (高度な設定) セクションを展開し、[Create an EMR cluster] (EMR クラスターを作成) を選択します。 Workspace を作成した後に Workspace UI の [EMR クラスター] パネルからクラスターを作成する。 開いている Workspace の左側のサイドバーにある [EMR クラスター] タブで、[高度な設定] セクションを展開し、[クラスターの作成] を選択します。 -
[Cluster name] (クラスター名) を入力します。クラスターに名前を付けると、後から EMR Studio クラスターリストでそのクラスターを見つけるのに役立ちます。
-
[Amazon EMR リリース] で、クラスターの Amazon EMR リリースバージョンを選択します。
-
[Instance] (インスタンス) で、クラスターの Amazon EC2 インスタンスのタイプと数を選択します。インスタンスタイプの選択の詳細については、「Amazon EMR で使用するために Amazon EC2 インスタンスを設定する」を参照してください。1 つのインスタンスがプライマリノードとして使用されます。
-
EMR Studio が新しいクラスターを起動できる [Subnet] (サブネット) を選択します。各サブネットオプションは Studio 管理者によって事前承認され、Workspace はリストされたサブネット内のクラスターに接続できる必要があります。
-
[S3 URI for log storage] (ログストレージの S3 URI) を選択します。
-
[Create EMR cluster] (EMR クラスターの作成) を選択して、クラスターをプロビジョニングします。[Workspace の作成] ダイアログボックスを使用する場合、[Workspace の作成] を選択して、Workspace を作成し、クラスターをプロビジョニングします。EMR Studio は新しいクラスターをプロビジョニングした後に、クラスターを Workspace にアタッチします。
クラスターテンプレートを使用してクラスターを作成するには
-
開始点を選択します。
実行方法 手順 [Create a Workspace] (Workspace の作成) ダイアログボックスを使用して Workspace を作成するときにクラスターを作成する。 [Create a Workspace] (Workspace の作成) ダイアログボックスで [Advanced configuration] (高度な設定) セクションを展開し、[Use a cluster template] (クラスターテンプレートの使用) を選択します。 Workspace UI の [EMR クラスター] パネルからクラスターを作成する。 開いている Workspace の左側のサイドバーにある [EMR クラスター] タブで、[高度な設定] セクションを展開し、[クラスターテンプレート] を選択します。 -
ドロップダウンリストからクラスターテンプレートを選択します。使用可能な各クラスタテンプレートには、選択に役立つ簡単な説明が含まれています。
-
選択したクラスターテンプレートには、Amazon EMR リリースバージョンやクラスター名などの追加のパラメーターが含まれる場合があります。値を選択または挿入するか、管理者が選択したデフォルト値を使用できます。
-
EMR Studio が新しいクラスターを起動できる [Subnet] (サブネット) を選択します。各サブネットオプションは Studio 管理者によって事前承認され、Workspace はサブネット内のクラスターに接続できる必要があります。
-
[Use cluster template] (クラスターテンプレートの使用) を選択して、クラスターをプロビジョニングし、Workspace にアタッチします。EMR Studio がクラスターを作成するまでに数分かかります。[Workspace の作成] ダイアログボックスを使用する場合、[Workspace の作成] を選択して、Workspace を作成し、クラスターをプロビジョニングします。EMR Studio は新しいクラスターをプロビジョニングした後に、クラスターを Workspace にアタッチします。
EMR Studio Workspace からコンピューティングをデタッチする
Workspace にアタッチされているクラスターを交換するには、Workspace UI からクラスターをデタッチします。
Workspace からクラスターをデタッチするには
-
クラスターからデタッチする Workspace で、左側のサイドバーから [EMR クラスター] アイコンを選択して、[クラスター] パネルを開きます。
-
[Select cluster] (クラスターの選択) で [Detach] (デタッチ) を選択し、EMR Studio によってクラスターがデタッチされるまで待ちます。クラスターがデタッチされると、成功メッセージが表示されます。
EMR Serverless アプリケーションを EMR Studio Workspace からデタッチするには
Workspace にアタッチされているコンピューティングを交換するには、Workspace UI からアプリケーションをデタッチします。
-
クラスターからデタッチする Workspace で、左側のサイドバーから [Amazon EMR コンピューティング] アイコンを選択して、[コンピューティング] パネルを開きます。
-
[コンピューティングの選択] で [デタッチ] を選択し、EMR Studio によってアプリケーションがデタッチされるまで待ちます。アプリケーションがデタッチされると、成功メッセージが表示されます。