翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Aurora PostgreSQL 互換 と の統合 AWS Glue
AWS Glue は、分析用のデータを準備してロードするためのフルマネージド型の抽出、変換、ロード (ETL) サービスです。Amazon Aurora PostgreSQL 互換エディション AWS Glue と統合して、あらゆるデータ処理および分析ワークフローに対応できます。
AWS Glue ユースケースと大まかなステップ
Aurora PostgreSQL 互換 と の統合では、次のユースケース AWS Glue がサポートされています。
-
データウェアハウスと分析 ‒ Aurora PostgreSQL 互換との統合を使用して AWS Glue 、データウェアハウスと分析ソリューションを構築します。 AWS Glue は、Aurora PostgreSQL 互換データベースからデータを抽出し、要件に応じて変換できます。その後、 AWS Glue は変換されたデータを Amazon Redshift や Amazon Athena などのデータウェアハウスにロードして、高度な分析とレポートを行うことができます。
-
データレイクの作成 - Aurora PostgreSQL 互換からデータを抽出し、Amazon S3 に保存されているデータレイクにロード AWS Glue するために使用します。その後、このデータレイクを機械学習、データ探索、その他の分析システムの供給など、さまざまな目的で使用できます。
-
ETL パイプライン ‒ AWS Glue サーバーレス ETL サービスを使用して堅牢なデータパイプラインを構築します。Aurora PostgreSQL 互換からデータを抽出し、Apache Spark または PySpark を使用して複雑な変換を実行できます。処理されたデータを Amazon S3 や Amazon Redshift などのターゲットにロードすることも 、Aurora PostgreSQL 互換にロードし直すこともできます。
-
データカタログ化とメタデータ管理 ‒ を使用して AWS Glue Data Catalog 、Aurora PostgreSQL 互換データベースとテーブルからメタデータを自動的にクロールおよびカタログ化します。Amazon Athena や Amazon Redshift Spectrum AWS のサービス などの は、この一元化されたメタデータリポジトリを使用してデータのクエリと分析を行うことができます。
-
機械学習のためのデータ準備 ‒ 機械学習 (ML) ワークロード用に Aurora PostgreSQL 互換からデータを準備 AWS Glue するために使用します。処理されたデータは、モデルのトレーニングとデプロイのために Amazon SageMaker AI または他の ML サービスにロードできます。
-
データ移行とレプリケーション AWS Database Migration Service ‒ (AWS DMS) はデータベース移行の主要なサービスですが、 を使用することもできます AWS Glue。Aurora PostgreSQL 互換から Amazon S3、Amazon Redshift、またはその他のデータベースエンジンなどの他のデータストアにデータを移行またはレプリケートします。
組織は、Aurora PostgreSQL 互換のスケーラビリティ、パフォーマンス、互換性を備えた AWS データ統合および分析サービスの能力を使用できます。これらのユースケースでは、堅牢なデータパイプラインを構築し、複雑なデータ変換を実行し、他の と統合 AWS のサービス して高度な分析とレポートを行うことができます。
Aurora PostgreSQL 互換を と統合するには AWS Glue、以下の大まかなステップを使用します。
-
にサインインし AWS マネジメントコンソール、 AWS Glue コンソールに移動して、 を作成します AWS Glue Data Catalog。
Data Catalog は、Aurora PostgreSQL 互換データベースやテーブルなど、データソースに関するメタデータを保存する中央リポジトリです。
-
AWS Glue 接続を作成します。
Connections ページに移動し、 AWS Glue 接続を作成します。接続タイプとして Aurora PostgreSQL 互換を選択し、Aurora PostgreSQL 互換クラスターエンドポイント、データベース名、データベースのユーザー名とパスワードを指定します。
-
Aurora PostgreSQL 互換データソースをクロールします。
クローラセクションに移動し、作成した接続を使用するように設定されたクローラを作成します。クロールしてデータカタログに含めるデータベースとテーブル名を指定し、クローラを実行します。
-
ETL AWS Glue ジョブを作成して実行します。
ジョブセクションに移動し、データカタログを使用して Aurora PostgreSQL 互換データベースからデータにアクセスしてクエリを実行する ETL ジョブを作成します。要件に基づいてジョブタイプを選択します。ETL ジョブスクリプトで、必要な変換または処理を実行し、処理されたデータのターゲットの場所を指定します。ターゲットの場所は、Amazon S3、Amazon Redshift、または別の Aurora PostgreSQL 互換データベースです。
詳細な手順については、 AWS Glue ドキュメントを参照してください。