View a markdown version of this page

Aurora PostgreSQL 互換 と の統合 AWS Glue - AWS 規範ガイダンス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Aurora PostgreSQL 互換 と の統合 AWS Glue

AWS Glue は、分析用のデータを準備してロードするためのフルマネージド型の抽出、変換、ロード (ETL) サービスです。Amazon Aurora PostgreSQL 互換エディション AWS Glue と統合して、あらゆるデータ処理および分析ワークフローに対応できます。

AWS Glue ユースケースと大まかなステップ

Aurora PostgreSQL 互換 と の統合では、次のユースケース AWS Glue がサポートされています。

  • データウェアハウスと分析 ‒ Aurora PostgreSQL 互換との統合を使用して AWS Glue 、データウェアハウスと分析ソリューションを構築します。 AWS Glue は、Aurora PostgreSQL 互換データベースからデータを抽出し、要件に応じて変換できます。その後、 AWS Glue は変換されたデータを Amazon Redshift や Amazon Athena などのデータウェアハウスにロードして、高度な分析とレポートを行うことができます。

  • データレイクの作成 - Aurora PostgreSQL 互換からデータを抽出し、Amazon S3 に保存されているデータレイクにロード AWS Glue するために使用します。その後、このデータレイクを機械学習、データ探索、その他の分析システムの供給など、さまざまな目的で使用できます。

  • ETL パイプライン ‒ AWS Glue サーバーレス ETL サービスを使用して堅牢なデータパイプラインを構築します。Aurora PostgreSQL 互換からデータを抽出し、Apache Spark または PySpark を使用して複雑な変換を実行できます。処理されたデータを Amazon S3 や Amazon Redshift などのターゲットにロードすることも 、Aurora PostgreSQL 互換にロードし直すこともできます。

  • データカタログ化とメタデータ管理 ‒ を使用して AWS Glue Data Catalog 、Aurora PostgreSQL 互換データベースとテーブルからメタデータを自動的にクロールおよびカタログ化します。Amazon Athena や Amazon Redshift Spectrum AWS のサービス などの は、この一元化されたメタデータリポジトリを使用してデータのクエリと分析を行うことができます。

  • 機械学習のためのデータ準備 ‒ 機械学習 (ML) ワークロード用に Aurora PostgreSQL 互換からデータを準備 AWS Glue するために使用します。処理されたデータは、モデルのトレーニングとデプロイのために Amazon SageMaker AI または他の ML サービスにロードできます。

  • データ移行とレプリケーション AWS Database Migration Service ‒ (AWS DMS) はデータベース移行の主要なサービスですが、 を使用することもできます AWS Glue。Aurora PostgreSQL 互換から Amazon S3、Amazon Redshift、またはその他のデータベースエンジンなどの他のデータストアにデータを移行またはレプリケートします。

組織は、Aurora PostgreSQL 互換のスケーラビリティ、パフォーマンス、互換性を備えた AWS データ統合および分析サービスの能力を使用できます。これらのユースケースでは、堅牢なデータパイプラインを構築し、複雑なデータ変換を実行し、他の と統合 AWS のサービス して高度な分析とレポートを行うことができます。

Aurora PostgreSQL 互換を と統合するには AWS Glue、以下の大まかなステップを使用します。

  1. にサインインし AWS マネジメントコンソール、 AWS Glue コンソールに移動して、 を作成します AWS Glue Data Catalog。

    Data Catalog は、Aurora PostgreSQL 互換データベースやテーブルなど、データソースに関するメタデータを保存する中央リポジトリです。

  2. AWS Glue 接続を作成します。

    Connections ページに移動し、 AWS Glue 接続を作成します。接続タイプとして Aurora PostgreSQL 互換を選択し、Aurora PostgreSQL 互換クラスターエンドポイント、データベース名、データベースのユーザー名とパスワードを指定します。

  3. Aurora PostgreSQL 互換データソースをクロールします。

    クローラセクションに移動し、作成した接続を使用するように設定されたクローラを作成します。クロールしてデータカタログに含めるデータベースとテーブル名を指定し、クローラを実行します。

  4. ETL AWS Glue ジョブを作成して実行します。

    ジョブセクションに移動し、データカタログを使用して Aurora PostgreSQL 互換データベースからデータにアクセスしてクエリを実行する ETL ジョブを作成します。要件に基づいてジョブタイプを選択します。ETL ジョブスクリプトで、必要な変換または処理を実行し、処理されたデータのターゲットの場所を指定します。ターゲットの場所は、Amazon S3、Amazon Redshift、または別の Aurora PostgreSQL 互換データベースです。

詳細な手順については、 AWS Glue ドキュメントを参照してください。