翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
ユーザーガイド
このセクションでは、データサイエンティストとデータエンジニアが Studio または Studio Classic から Amazon EMRクラスターを起動、検出、接続、または終了する方法について説明します。
ユーザーがクラスターを一覧表示または起動する前に、管理者は Studio 環境で必要な設定を設定しておく必要があります。管理者が Studio 環境を設定して Amazon EMRクラスターのセルフプロビジョニングと一覧表示を許可する方法については、「」を参照してください管理者ガイド。
トピック
- Studio または Studio Classic から Amazon EMRクラスターに接続するためのサポートされているイメージとカーネル
- 独自のイメージを使用する
- Studio または Studio Classic から Amazon EMRクラスターを起動する
- Studio または Studio Classic から Amazon EMRクラスターを一覧表示する
- SageMaker Studio または Studio Classic から Amazon EMRクラスターに接続する
- Studio または Studio Classic から Amazon EMRクラスターを終了する
- Studio または Studio Classic から Spark UI にアクセスする
Studio または Studio Classic から Amazon EMRクラスターに接続するためのサポートされているイメージとカーネル
次のイメージとカーネルにはsagemaker-studio-analytics-extension
-
Studio ユーザーの場合: SageMaker Distribution は、ノートブックインスタンスの JupyterLabデフォルトイメージとして使用されるデータサイエンス用の Docker 環境です。ディスSageMakerトリビューション
のすべてのバージョンには sagemaker-studio-analytics-extension
、プリインストールされています。 -
Studio Classic ユーザーの場合: 以下のイメージは がプリインストールされています
sagemaker-studio-analytics-extension
。-
DataScience – Python 3 カーネル
-
DataScience 2.0 – Python 3 カーネル
-
DataScience 3.0 – Python 3 カーネル
-
SparkAnalytics 1.0 – SparkMagic PySpark およびカーネル
-
SparkAnalytics 2.0 – SparkMagic PySpark およびカーネル
-
SparkMagic – SparkMagic PySpark およびカーネル
-
PyTorch 1.8 – Python 3 カーネル
-
TensorFlow 2.6 – Python 3 カーネル
-
TensorFlow 2.11 – Python 3 カーネル
-
別の組み込みイメージまたは独自のイメージを使用して Amazon EMRクラスターに接続するには、「」の手順に従います独自のイメージを使用する。
独自のイメージを使用する
Studio または Studio Classic で独自のイメージを持ち込んでノートブックを Amazon EMRクラスターに接続できるようにするには、カーネルに次のsagemaker-studio-analytics-extension
pip install sparkmagic pip install sagemaker-studio-sparkmagic-lib pip install sagemaker-studio-analytics-extension
さらに、Kerberos 認証EMRを使用して Amazon に接続するには、kinit クライアントをインストールする必要があります。お使いの OS によって、kinit クライアントをインストールするコマンドは異なる場合があります。Ubuntu (Debian ベース) イメージを取り込むには、apt-get
install -y -qq krb5-user
コマンドを使用します。
SageMaker Studio または Studio Classic で独自のイメージを持ち込む方法の詳細については、「独自の SageMaker イメージを持ち込む」を参照してください。