翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Studio から EMR サーバーレスアプリケーションに接続する
データサイエンティストとデータエンジニアは、Studio ユーザーインターフェイスから直接 EMR Serverless アプリケーションを検出して接続できます。開始する前に、「」の手順に従って EMR Serverless アプリケーションを作成済みであることを確認しますStudio からEMRサーバーレスアプリケーションを作成する。
EMR サーバーレスアプリケーションを Studio UI から直接新しい JupyterLab ノートブックに接続するか、実行中の JupyterLab アプリケーションのノートブックで接続を開始するかを選択できます。
重要
Studio を使用する場合、プライベートスペースから起動されるアプリケーションのEMRサーバーレス JupyterLab アプリケーションのみを検出して接続できます。EMR Serverless アプリケーションが Studio 環境と同じ AWS リージョンにあることを確認します。 JupyterLab スペースには、 SageMaker ディストリビューションイメージのバージョン 1.10
以上を使用する必要があります。
Studio UI からEMRサーバーレスアプリケーションを新しい JupyterLab ノートブックに接続するには:
-
Studio UI で、左側のパネルに移動し、左側のナビゲーションメニューで [データ] ノードを選択します。次に、スクロールして Amazon EMRアプリケーションとクラスターオプションを選択します。これにより、Studio 環境内からアクセスできる Amazon アプリケーションがサーバーレスEMRアプリケーションタブの下に表示されるページが開きます。
注記
自分または管理者が EMR Serverless アプリケーションへのクロスアカウントアクセスを許可するアクセス許可を設定している場合は、Studio へのアクセスを許可したすべてのアカウントのアプリケーションの統合リストを表示できます。
-
新しいノートブックに接続するEMRサーバーレスアプリケーションを選択し、ノートブックにアタッチを選択します。これにより、モーダルウィンドウが開き、 JupyterLab スペースのリストが表示されます。
-
-
アプリケーションを起動 JupyterLabするプライベートスペースを選択し、ノートブックを開くを選択します。これにより、選択したスペースから JupyterLab アプリケーションが起動し、新しいノートブックが開きます。
-
別の方法として、モーダルウィンドウの上部にある[新しいスペースの作成] ボタンをクリックして、新しいプライベートスペースを作成することもできます。スペース名を入力してから、[スペースを作成してノートブックを開く] をクリックします。これにより、デフォルトのインスタンスタイプと使用可能な最新の SageMaker ディストリビューションイメージを持つプライベートスペースが作成され、 JupyterLab アプリケーションが起動され、新しいノートブックが開きます。
-
-
EMR Serverless アプリケーションがジョブ実行のために引き受けることができるIAMランタイム実行ロールの名前を選択します。選択すると、接続コマンドによってノートブックの最初のセルが入力され、EMRサーバーレスアプリケーションとの接続が開始されます。
重要
JupyterLab ノートブックを EMR Serverless アプリケーションに正常に接続するには、「」で説明されているように、まずランタイムロールのリストをドメインまたはユーザープロファイルに関連付ける必要があります SageMaker Studio からの Amazon EMRアプリケーションの一覧表示と起動を有効にするアクセス許可を設定する。このステップが完了していないと、接続を確立できません。
接続が成功すると、接続の確認、EMRサーバーレスアプリケーションの起動、Spark セッションの開始のメッセージが表示されます。
注記
EMR Serverless アプリケーションに接続すると、そのステータスは
Stopped
または からCreated
に移行しますStarted
。
または、 JupyterLab ノートブックからクラスターに接続することもできます。
-
ノートブックの右上にある [クラスター] ボタンをクリックします。これにより、アクセスできるEMRサーバーレスアプリケーションが一覧表示されたモーダルウィンドウが開きます。アプリケーションは、[サーバーレスアプリケーション] タブで確認できます。
-
接続するアプリケーションを選択して、[接続] をクリックします。
-
EMR Serverless は、「」で説明されているように、必要なアクセス許可を設定するときにプリロードされたランタイムIAMロールをサポートします SageMaker Studio からの Amazon EMRアプリケーションの一覧表示と起動を有効にするアクセス許可を設定する。このステップが完了していないと、接続を確立できません。
Amazon EMR実行ロールのドロップダウンメニューからロールを選択できます。EMR サーバーレスに接続すると、Studio はノートブックのアクティブなセルにコードブロックを追加して接続を確立します。
-
アクティブセルが入力されて実行されます。このセルには、ノートブックをアプリケーションに接続するための接続 Magic コマンドが含まれています。
接続に成功すると、接続と Spark アプリケーションの起動を確認するメッセージが表示されます。EMR Serverless アプリケーションへのデータ処理ジョブの送信を開始できます。