ユーザーガイド - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ユーザーガイド

このセクションでは、データサイエンティストとデータエンジニアが Studio または Studio Classic から Amazon EMR クラスターを起動、検出、接続、または終了できる方法について説明します。

ユーザーがクラスターを一覧表示または起動できるようにする前に、管理者は Studio 環境で必要な設定を指定しておく必要があります。Amazon EMR クラスターのセルフプロビジョニングと一覧表示を許可するように、管理者が Studio 環境を設定する方法については、「管理者ガイド」を参照してください。

Studio または Studio Classic から Amazon EMR クラスターに接続するためにサポートされているイメージとカーネル

以下のイメージとカーネルには、Apache Livy を使用して SparkMagic ライブラリ経由でリモートの Spark (Amazon EMR) クラスターに接続できるようにする JupyterLab 拡張機能である sagemaker-studio-analytics-extension を備えています。

  • Studio を使用する場合: SageMaker Distribution は、JupyterLab ノートブックインスタンスのデフォルトイメージとして使用されるデータサイエンス向けの Docker 環境です。SageMaker AI Distribution のすべてのバージョンには、 がsagemaker-studio-analytics-extensionプリインストールされています。

  • Studio Classic を使用する場合: sagemaker-studio-analytics-extension には、以下のイメージがプリインストールされています。

    • DataScience – Python 3 カーネル

    • DataScience 2.0 – Python 3 カーネル

    • DataScience 3.0 – Python 3 カーネル

    • SparkAnalytics 1.0 – SparkMagic および PySpark カーネル

    • SparkAnalytics 2.0 – SparkMagic および PySpark カーネル

    • SparkMagic – SparkMagic および PySpark カーネル

    • PyTorch 1.8 – Python 3 カーネル

    • TensorFlow 2.6 – Python 3 カーネル

    • TensorFlow 2.11 – Python 3 カーネル

別の組み込みイメージまたは独自のイメージを使用して Amazon EMR クラスターに接続するには、「独自のイメージを使用する」の手順に従ってください。

独自のイメージを使用する

Studio または Studio Classic で独自のイメージを使用し、ノートブックを Amazon EMR クラスターに接続できるようにするには、以下の sagemaker-studio-analytics-extension 拡張機能をカーネルにインストールします。これは、SparkMagic ライブラリを介したSageMaker Studio ノートブックまたは Studio Classic ノートブックの Spark (Amazon EMR) クラスターへの接続をサポートしています。

pip install sparkmagic pip install sagemaker-studio-sparkmagic-lib pip install sagemaker-studio-analytics-extension

Kerberos 認証を使用して Amazon EMR に接続する場合は、kinit クライアントをインストールする必要があります。お使いの OS によって、kinit クライアントをインストールするコマンドは異なる場合があります。Ubuntu (Debian ベース) イメージを取り込むには、apt-get install -y -qq krb5-user コマンドを使用します。

SageMaker Studio または Studio Classic で独自のイメージを持ち込む方法の詳細については、「Bring your own SageMaker AI image」を参照してください。