Studio または Studio Classic から SageMaker Amazon EMRクラスターに接続する - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Studio または Studio Classic から SageMaker Amazon EMRクラスターに接続する

Studio のユーザーは、デフォルトの を使用して、 JupyterLab ノートブックから実行中の Amazon EMRクラスターに接続できますSageMaker ディストリビューションイメージ。Studio Classic のユーザーは、サポートされているカーネル のいずれかを使用して Studio Classic ノートブックからクラスターに接続できます。

Studio UI を使用して Amazon EMRクラスターに接続する

Studio または Studio Classic UI を使用してクラスターに接続するには、 でアクセスされたクラスターのリストからStudio または Studio Classic から Amazon EMRクラスターを一覧表示する、または SageMaker Studio または Studio Classic のノートブックから接続を開始できます。

クラスターのリストから特定のクラスターに接続するには
  1. リストからクラスターの名前を選択します。これにより、[新しいノートブックにアタッチ] ボタンが有効になります。

  2. [新しいノートブックにアッタッチ] を選択します。イメージとカーネルの選択ボックスが開きます。

  3. イメージとカーネルを選択し、[選択] を選択します。サポートされているイメージのリストについては、「Studio または Studio Classic から Amazon EMRクラスターに接続するためにサポートされているイメージとカーネル」または「独自のイメージを使用する」を参照してください。

  4. 選択したクラスターが Kerberos、、LDAPまたはランタイムロール認証を使用しない場合、Studio または Studio Classic は認証情報タイプを選択するように求めます。[HTTP 基本認証] または [認証情報なし] を選択し、該当する場合は認証情報を入力します。接続コマンドはノートブックの最初のセルに入力し、Amazon EMRクラスターとの接続を開始します。

    接続に成功すると、接続と Spark アプリケーションの起動を確認するメッセージが表示されます。

または、ノートブックからクラスターに接続することもできます。
  1. ノートブックの上部にある [クラスター] を選択します。

    [クラスター] は、「Studio または Studio Classic から Amazon EMRクラスターに接続するためにサポートされているイメージとカーネル」または「独自のイメージを使用する」のカーネルを使用した場合にのみ表示されます。ノートブックの上部に [クラスター] が表示されない場合は、管理者がクラスターの検出可能性を設定していることを確認し、サポートされているカーネルに切り替えてください。

    これにより、 Running 状態の使用可能なクラスターのリストが開きます。

  2. 接続するクラスターを選択し、[接続] を選択します。

  3. ランタイムIAMロールをサポートするように Amazon EMRクラスターを設定し、管理者が実行ロール設定 でロールをプリロードした場合はJSON、Amazon 実行ロールのドロップダウンメニューから Amazon EMR アクセスロールを選択できます。 EMR ロールがプリロードされていない場合、Studio または Studio Classic はデフォルトで Studio または Studio Classic の実行ロールを使用します。Amazon でランタイムロールを使用する方法については、EMR「」を参照してくださいランタイムIAMロールを使用して Studio Classic から Amazon EMRクラスターに接続する。クラスターに接続すると、Studio または Studio Classic はアクティブなセルにコードブロックを追加して接続を確立します。

    それ以外の場合、選択したクラスターが Kerberos、LDAP、またはランタイムロール認証を使用しない場合、Studio または Studio Classic は認証情報タイプを選択するように求めます。HTTP 基本認証 または認証情報なし を選択できます。

  4. アクティブセルが入力されて実行されます。このセルには、Amazon EMRクラスターに接続するための接続コマンドが含まれています。

    接続に成功すると、接続と Spark アプリケーションの起動を確認するメッセージが表示されます。

接続コマンドを使用して Amazon EMRクラスターに接続する

Amazon EMRクラスターへの接続を確立するには、ノートブックセル内で接続コマンドを実行します。

接続を確立するときは、KerberosLightweight Directory Access Protocol (LDAP)、またはランタイムIAMロール認証を使用して認証できます。選択した認証方法は、クラスターの設定によって異なります。

この例の Access Apache Livy は、Kerberos 対応 Amazon EMRクラスターの Network Load Balancer を使用して、Kerberos 認証を使用する Amazon EMRクラスターをセットアップします。または、aws-samples/sagemaker-studio-emr GitHub repository で Kerberos またはLDAP認証を使用して CloudFormation サンプルテンプレートを調べることもできます。

管理者がクロスアカウントアクセスを有効にしている場合は、Studio Classic アプリケーションとEMRクラスターが同じアカウントにあるか、異なる AWS アカウントにあるかに関係なく、Studio Classic ノートブックから Amazon クラスターに接続できます。

次の認証タイプごとに、指定されたコマンドを使用して Studio または Studio Classic ノートブックからクラスターに接続します。

  • Kerberos

    クロスアカウント Amazon EMR アクセスが必要な場合は、 --assumable-role-arn引数を追加します。を使用してクラスターに接続する場合は、 --verify-certificate引数を追加しますHTTPS。

    %load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --cluster-id cluster_id \ --auth-type Kerberos --language python [--assumable-role-arn EMR_access_role_ARN ] [--verify-certificate /home/user/certificateKey.pem]
  • LDAP

    クロスアカウント Amazon EMR アクセスが必要な場合は、 --assumable-role-arn引数を追加します。を使用してクラスターに接続する場合は、 --verify-certificate引数を追加しますHTTPS。

    %load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --cluster-id cluster_id \ --auth-type Basic_Access --language python [--assumable-role-arn EMR_access_role_ARN ] [--verify-certificate /home/user/certificateKey.pem]
  • NoAuth

    クロスアカウント Amazon EMR アクセスが必要な場合は、 --assumable-role-arn引数を追加します。を使用してクラスターに接続する場合は、 --verify-certificate引数を追加しますHTTPS。

    %load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --cluster-id cluster_id \ --auth-type None --language python [--assumable-role-arn EMR_access_role_ARN ] [--verify-certificate /home/user/certificateKey.pem]
  • ランタイムIAMロール

    クロスアカウント Amazon EMR アクセスが必要な場合は、 --assumable-role-arn引数を追加します。を使用してクラスターに接続する場合は、 --verify-certificate引数を追加しますHTTPS。

    ランタイムIAMロールを使用して Amazon EMRクラスターに接続する方法の詳細については、「」を参照してくださいランタイムIAMロールを使用して Studio Classic から Amazon EMRクラスターに接続する

    %load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --cluster-id cluster_id \ --auth-type Basic_Access \ --emr-execution-role-arn arn:aws:iam::studio_account_id:role/emr-execution-role-name [--assumable-role-arn EMR_access_role_ARN] [--verify-certificate /home/user/certificateKey.pem]

経由で Amazon EMRクラスターに接続する HTTPS

のトランジット暗号化が有効で Apache Livy サーバーを使用して Amazon EMRクラスターを設定しHTTPS、Studio または Studio Classic が EMRを使用して Amazon と通信する場合はHTTPS、証明書キーにアクセスするように Studio または Studio Classic を設定する必要があります。

自己署名証明書またはローカル認証局 (CA) 署名証明書の場合、2 つのステップでこれを行うことができます。

  1. 次のいずれかのオプションを使用して、証明書のPEMファイルをローカルファイルシステムにダウンロードします。

  2. 接続コマンドの --verify-certificate 引数に証明書へのパスを指定して、証明書の検証を有効にします。

    %sm_analytics emr connect --cluster-id cluster_id \ --verify-certificate /home/user/certificateKey.pem ...

パブリック CA が発行する証明書の場合は、--verify-certificate パラメータを true に設定して証明書の検証を設定します。

または、--verify-certificate パラメータを false に設定して証明書の検証を無効にすることもできます。

Amazon EMRクラスターに対して使用可能な接続コマンドのリストは、「」で確認できます接続コマンドを使用して Amazon EMRクラスターに接続する