Amazon を使用したデータ準備 EMR - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon を使用したデータ準備 EMR

重要

Amazon SageMaker Studio と Amazon SageMaker Studio Classic は、 を操作するために使用できる機械学習環境の 2 つです SageMaker。

ドメインが 2023 年 11 月 30 日以降に作成された場合、Studio がデフォルトのエクスペリエンスになります。

ドメインが 2023 年 11 月 30 日より前に作成された場合、Amazon SageMaker Studio Classic がデフォルトのエクスペリエンスになります。Amazon Studio Classic がデフォルトのエクスペリエンスである場合に SageMaker Studio を使用するには、「」を参照してくださいAmazon SageMaker Studio Classic からの移行

Amazon SageMaker Studio Classic から Amazon SageMaker Studio に移行すると、機能の可用性が失われることはありません。Studio Classic は、レガシー機械学習ワークフローの実行に役立つ Amazon SageMaker Studio 内のアプリケーションとしても存在します。

Amazon SageMaker Studio と Studio Classic には、Amazon EMRとの統合が組み込まれています。 JupyterLab および Studio Classic ノートブック内で、データサイエンティストとデータエンジニアは既存の Amazon EMRクラスターを検出して接続し、Apache SparkApache Hive 、または Presto を使用して機械学習用の大規模なデータをインタラクティブに調査、視覚化、準備できます。ワンクリックで Spark UI にアクセスして、ノートブックを離れることなく Spark ジョブのステータスとメトリクスをモニタリングできます。

管理者は、Amazon EMRクラスターを定義するAWS CloudFormation テンプレートを作成できます。その後、Studio および AWS Service Catalog Studio Classic ユーザーの でこれらのクラスターテンプレートを起動できるようになります。その後、データサイエンティストは事前定義されたテンプレートを選択して、Studio 環境から直接 Amazon EMRクラスターをセルフプロビジョニングできます。管理者はテンプレートをさらにパラメータ化して、ユーザーが事前定義された値内でクラスターの側面を選択できるようにします。例えば、ユーザーはコアノードの数を指定したり、ドロップダウンメニューからノードのインスタンスタイプを選択したりできます。

を使用すると AWS CloudFormation、管理者は Amazon EMRクラスターの組織、セキュリティ、ネットワークのセットアップを制御できます。データサイエンティストとデータエンジニアは、ワークロードに合わせてこれらのテンプレートをカスタマイズして、複雑な設定を行わずに Studio と Studio Classic から直接オンデマンドの Amazon EMRクラスターを作成できます。ユーザーは、使用後に Amazon EMRクラスターを終了できます。