Amazon EMR Studio - Amazon EMR

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon EMR Studio

Amazon EMR Studio は、Amazon EMR クラスターで実行される、フルマネージド型の Jupyter Notebook 用のウェブベースの統合開発環境 (IDE) です。チームが R、Python、Scala、および PySpark で記述されたアプリケーションの開発、視覚化、およびデバッグを行うために EMR Studio をセットアップできます。EMR Studio は AWS Identity and Access Management (IAM) および IAM Identity Center と統合されているため、ユーザーは企業の認証情報を使用してログインできます。

EMR Studio は無料で作成できます。EMR Studio を使用する場合は、Amazon S3 ストレージと Amazon EMR クラスターに適用される料金が適用されます。製品の詳細とハイライトについては、Amazon EMR Studio のサービスページを参照してください。

EMR Studio の主な機能

Amazon EMR Studio には次の機能があります。

  • AWS Identity and Access Management (IAM) を使用して、または信頼できる ID の伝播とエンタープライズ ID プロバイダー AWS IAM Identity Center の有無にかかわらず、ユーザーを認証します。

  • Amazon EMR クラスターにオンデマンドでアクセスして起動し、Jupyter Notebook ジョブを実行します。

  • Amazon EMR on EKS クラスターに接続して、ジョブ実行として作業を送信する。

  • サンプルノートブックを探索して保存する。サンプルノートブックの詳細については、「EMR Studio Notebook Examples」GitHub リポジトリを参照してください。

  • Python、PySpark、Spark Scala、Spark R、または SparkSQL を使用してデータを分析し、カスタムカーネルとライブラリをインストールする。

  • 同じ Workspace 内の他のユーザーとリアルタイムでコラボレーションできます。詳細については、「EMR Studio で Workspace コラボレーションを設定する」を参照してください。

  • ノートブック内のデータを操作する前に、EMR Studio SQL Explorer を使用してデータカタログを参照し、SQL クエリを実行し、結果をダウンロードします。

  • Apache Airflow や Amazon Managed Workflows for Apache Airflow などのオーケストレーションツールを使用して、スケジュールされたワークフローの一部としてパラメータ化されたノートブックを実行する。詳細については、 AWS Big Data Blog の「Ochestrating analytics jobs on EMR Notebooks using MWAA」を参照してください。

  • GitHub や BitBucket などのコードリポジトリをリンクします。

  • Spark History Server、Tez UI、または YARN タイムラインサーバーを使用してジョブを追跡およびデバッグする。

EMR Studio は HIPAA 対応であり、HITRUST CSF および SOC 2 の下で認定されています。 AWS サービスの HIPAA コンプライアンスの詳細については、「」を参照してくださいhttps://aws.amazon.com/compliance/hipaa-compliance/。 AWS サービスの HITRUST CSF コンプライアンスの詳細については、「」を参照してくださいhttps://aws.amazon.com/compliance/hitrust/

EMR Studio は FedRamp にも準拠しています。Amazon EMR が準拠するコンプライアンスプログラムの詳細については、「Amazon EMR のコンプライアンス検証」を参照してください。 AWS のサービスの追加コンプライアンスプログラムの詳細については、AWS 「コンプライアンスプログラムによる対象範囲内のサービス」を参照してください。

Amazon EMR Studio の機能履歴

この表に、Amazon EMR Managed Scaling 機能の更新を示します。

リリース日 機能
2024 年 1 月 5 日

AWS GovCloud (米国東部) および AWS GovCloud (米国西部) の EMR Studio のサポートが追加されました。

2023 年 11 月 26 日

IAM Identity Center 認証を使用した EMR Studio の信頼できる ID 伝達のサポートが追加されました。

2023 年 10 月 26 日

インタラクティブ機能を備えた EMR Serverless アプリケーションを作成する機能が追加されました。

2023 年 2 月 28 日

EMR Serverless アプリケーションのアプリケーションログストレージに AWS KMS カスタマーマネージドキーサポートが追加されました。

2023 年 2 月 23 日

EMR Serverless ジョブ送信用の IAM ロールをワンクリックで作成できるようになりました。EMR Serverless アプリケーションのカスタムイメージを選択するときの ECR ルックアップを追加しました。

2023 年 1 月 27 日

ヘッドレス実行ノートブックは、%execute_notebook マジックで各セル実行の進行状況を追跡できます。

2023 年 1 月 23 日

永続アプリケーションは起動時間を短縮できるよう最適化されています。