ユーザーガイド - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ユーザーガイド

このセクションでは、データサイエンティストとデータエンジニアが Studio または Studio Classic から Amazon EMRクラスターを起動、検出、接続、または終了する方法について説明します。

ユーザーがクラスターを一覧表示または起動する前に、管理者は Studio 環境で必要な設定を設定しておく必要があります。管理者が Studio 環境を設定して Amazon EMRクラスターのセルフプロビジョニングと一覧表示を許可する方法については、「」を参照してください管理者ガイド

Studio または Studio Classic から Amazon EMRクラスターに接続するためのサポートされているイメージとカーネル

次のイメージとカーネルにはsagemaker-studio-analytics-extension、Apache Livy を使用してSparkMagicライブラリを介してリモート Spark (Amazon EMR) クラスターに接続する JupyterLab 拡張機能である が付属しています。 https://livy.apache.org/

  • Studio ユーザーの場合: SageMaker Distribution は、ノートブックインスタンスの JupyterLabデフォルトイメージとして使用されるデータサイエンス用の Docker 環境です。ディスSageMakerトリビューションのすべてのバージョンにはsagemaker-studio-analytics-extension、プリインストールされています。

  • Studio Classic ユーザーの場合: 以下のイメージは がプリインストールされていますsagemaker-studio-analytics-extension

    • DataScience – Python 3 カーネル

    • DataScience 2.0 – Python 3 カーネル

    • DataScience 3.0 – Python 3 カーネル

    • SparkAnalytics 1.0 – SparkMagic PySpark およびカーネル

    • SparkAnalytics 2.0 – SparkMagic PySpark およびカーネル

    • SparkMagic – SparkMagic PySpark およびカーネル

    • PyTorch 1.8 – Python 3 カーネル

    • TensorFlow 2.6 – Python 3 カーネル

    • TensorFlow 2.11 – Python 3 カーネル

別の組み込みイメージまたは独自のイメージを使用して Amazon EMRクラスターに接続するには、「」の手順に従います独自のイメージを使用する

独自のイメージを使用する

Studio または Studio Classic で独自のイメージを持ち込んでノートブックを Amazon EMRクラスターに接続できるようにするには、カーネルに次のsagemaker-studio-analytics-extension拡張機能をインストールします。Studio SageMaker または Studio Classic ノートブックをSparkMagicライブラリ経由で Spark (Amazon EMR) クラスターに接続できます。

pip install sparkmagic pip install sagemaker-studio-sparkmagic-lib pip install sagemaker-studio-analytics-extension

さらに、Kerberos 認証EMRを使用して Amazon に接続するには、kinit クライアントをインストールする必要があります。お使いの OS によって、kinit クライアントをインストールするコマンドは異なる場合があります。Ubuntu (Debian ベース) イメージを取り込むには、apt-get install -y -qq krb5-user コマンドを使用します。

SageMaker Studio または Studio Classic で独自のイメージを持ち込む方法の詳細については、「独自の SageMaker イメージを持ち込む」を参照してください。