AWS Glue DataBrew - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS Glue DataBrew

AWS Glue DataBrew は、データのクリーニング、正規化、変換のためのフルマネージド型のビジュアルデータ準備サービスです。 AWS Glue ETL とは異なり、使用する書き込みコードがない点が異なります。DataBrew には 250 種類以上の変換が組み込まれており、ポイントアンドクリックによる視覚的なインターフェイスにより、データ変換ジョブを作成および管理できます。

DataBrew は、 とは別のコンソールビューで使用できます AWS Glue。複数の AWS サービスとネイティブに統合されており、さまざまなファイル形式をサポートしています。詳細については、「製品とサービスの統合」を参照してください。

DataBrew は次の 6 つのコアコンセプトに基づいています:

  • プロジェクト – DataBrew のデータ準備ワークスペース全体

  • データセット – 構造化データまたは半構造化データのコレクション

  • レシピ – 一連のデータ変換ステップ。各ステップには多数のアクションを含めることができます。

  • ジョブ – レシピまたはデータプロファイルジョブを実行する一連の手順 

  • データリネージュ — ビジュアルインターフェイス内のデータを追跡して、そのオリジンを特定する

  • データプロファイル – データの形状の概要ビュー

AWS Glue DataBrew は と統合 AWS Glue Studioされているため、ETL ジョブとワークフロー内で DataBrew AWS Glue レシピをオーケストレーションできます。DataBrew レシピは、ジョブのブックマーク、自動再試行、自動スケーリングなどの機能を利用 AWS Glue することもできます。DataBrew の使用を開始するには、AWS Glue DataBrew サンプルプロジェクトチュートリアルを使用します。