翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon を使用したデータ準備 EMR
重要
Amazon SageMaker Studio と Amazon SageMaker Studio Classic は、 を操作するために使用できる機械学習環境の 2 つです SageMaker。
ドメインが 2023 年 11 月 30 日以降に作成された場合、Studio がデフォルトのエクスペリエンスになります。
ドメインが 2023 年 11 月 30 日より前に作成された場合、Amazon SageMaker Studio Classic がデフォルトのエクスペリエンスになります。Amazon Studio Classic がデフォルトのエクスペリエンスである場合に SageMaker Studio を使用するには、「」を参照してくださいAmazon SageMaker Studio Classic からの移行。
Amazon SageMaker Studio Classic から Amazon SageMaker Studio に移行すると、機能の可用性が失われることはありません。Studio Classic は、レガシー機械学習ワークフローの実行に役立つ Amazon SageMaker Studio 内のアプリケーションとしても存在します。
Amazon SageMaker Studio と Studio Classic には、Amazon EMRとの統合が組み込まれています。 JupyterLab および Studio Classic ノートブック内で、データサイエンティストとデータエンジニアは既存の Amazon EMRクラスターを検出して接続し、Apache Spark
管理者は、Amazon EMRクラスターを定義するAWS CloudFormation テンプレートを作成できます。その後、Studio および AWS Service Catalog Studio Classic ユーザーの でこれらのクラスターテンプレートを起動できるようになります。その後、データサイエンティストは事前定義されたテンプレートを選択して、Studio 環境から直接 Amazon EMRクラスターをセルフプロビジョニングできます。管理者はテンプレートをさらにパラメータ化して、ユーザーが事前定義された値内でクラスターの側面を選択できるようにします。例えば、ユーザーはコアノードの数を指定したり、ドロップダウンメニューからノードのインスタンスタイプを選択したりできます。
を使用すると AWS CloudFormation、管理者は Amazon EMRクラスターの組織、セキュリティ、ネットワークのセットアップを制御できます。データサイエンティストとデータエンジニアは、ワークロードに合わせてこれらのテンプレートをカスタマイズして、複雑な設定を行わずに Studio と Studio Classic から直接オンデマンドの Amazon EMRクラスターを作成できます。ユーザーは、使用後に Amazon EMRクラスターを終了できます。
-
管理者の場合:
Studio または Studio Classic と Amazon EMRクラスター間の通信が有効になっていることを確認します。手順については、「Amazon EMRクラスターのネットワークアクセスを設定する」を参照してください。この通信を有効にすると、次のことができます。
-
データサイエンティストまたはデータエンジニアの場合は、次のことができます。