Amazon Redshift での横串検索を使用したデータのクエリの実行
Amazon Redshift で横串検索を使用することにより、オペレーションデータベース、データウェアハウス、データレイク全体のデータをクエリして分析することができます。横串検索機能を使用すると、外部データベースのライブデータの Amazon Redshift からのクエリを、Amazon Redshift と Amazon S3 環境全体のクエリと統合できます。横串検索は、Amazon RDS for PostgreSQL、Amazon Aurora PostgreSQL 互換エディション、Amazon RDS for MySQL、および Amazon Aurora MySQL 互換エディション の外部データベースと連携することができます。
フェデレーテッドクエリにより、ビジネスインテリジェンス (BI) およびレポートアプリケーションの一部としてライブデータを組み込むことができます。たとえば、Amazon Redshift へのデータの取り込みを容易にするために、横串検索を使用して次の操作を実行できます。
-
運用データベースを直接照会します。
-
変換をすばやく適用します。
-
複雑な抽出、変換、ロード (ETL) パイプラインを必要とせずに、ターゲットテーブルにデータをロードします。
ネットワーク上でのデータ移動を減らし、パフォーマンスを向上させるために、Amazon Redshift は横串検索の計算の一部をリモートオペレーションデータベースに直接分散します。また、Amazon Redshift は並列処理能力を使用して、必要に応じてこれらのクエリの実行をサポートします。
横串検索を実行すると、Amazon Redshift は、まずリーダーノードから RDS または Aurora DB クラスター DB インスタンスへのクライアント接続を確立し、テーブルメタデータを取得します。コンピューティングノードから、Amazon Redshift は述語がプッシュダウンされたサブクエリを発行し、結果の行を取得します。次に、Amazon Redshift は結果の行をコンピューティングノード間で分散してさらに処理します。
Amazon Aurora PostgreSQL データベースまたは Amazon RDS for PostgreSQL データベースに送信されるクエリの詳細は、システムビュー SVL_FEDERATED_QUERY にログ記録されます 。