翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
ユーザーガイド
このセクションでは、データサイエンティストとデータエンジニアが Studio または Studio Classic から Amazon EMR クラスターを起動、検出、接続、または終了できる方法について説明します。
ユーザーがクラスターを一覧表示または起動できるようにする前に、管理者は Studio 環境で必要な設定を指定しておく必要があります。Amazon EMR クラスターのセルフプロビジョニングと一覧表示を許可するように、管理者が Studio 環境を設定する方法については、「管理者ガイド」を参照してください。
トピック
Studio または Studio Classic から Amazon EMR クラスターに接続するためにサポートされているイメージとカーネル
以下のイメージとカーネルには、Apache Livy
-
Studio を使用する場合: SageMaker Distribution は、JupyterLab ノートブックインスタンスのデフォルトイメージとして使用されるデータサイエンス向けの Docker 環境です。SageMaker AI Distribution
のすべてのバージョンには、 が sagemaker-studio-analytics-extension
プリインストールされています。 -
Studio Classic を使用する場合:
sagemaker-studio-analytics-extension
には、以下のイメージがプリインストールされています。-
DataScience – Python 3 カーネル
-
DataScience 2.0 – Python 3 カーネル
-
DataScience 3.0 – Python 3 カーネル
-
SparkAnalytics 1.0 – SparkMagic および PySpark カーネル
-
SparkAnalytics 2.0 – SparkMagic および PySpark カーネル
-
SparkMagic – SparkMagic および PySpark カーネル
-
PyTorch 1.8 – Python 3 カーネル
-
TensorFlow 2.6 – Python 3 カーネル
-
TensorFlow 2.11 – Python 3 カーネル
-
別の組み込みイメージまたは独自のイメージを使用して Amazon EMR クラスターに接続するには、「独自のイメージを使用する」の手順に従ってください。
独自のイメージを使用する
Studio または Studio Classic で独自のイメージを使用し、ノートブックを Amazon EMR クラスターに接続できるようにするには、以下の sagemaker-studio-analytics-extension
pip install sparkmagic pip install sagemaker-studio-sparkmagic-lib pip install sagemaker-studio-analytics-extension
Kerberos 認証を使用して Amazon EMR に接続する場合は、kinit クライアントをインストールする必要があります。お使いの OS によって、kinit クライアントをインストールするコマンドは異なる場合があります。Ubuntu (Debian ベース) イメージを取り込むには、apt-get
install -y -qq krb5-user
コマンドを使用します。
SageMaker Studio または Studio Classic で独自のイメージを持ち込む方法の詳細については、「Bring your own SageMaker AI image」を参照してください。