Union を使用して行を結合する - AWS Glue

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Union を使用して行を結合する

Union 変換ノードは、同じスキーマを持つ複数のデータソースの行を結合する場合に使用します。

Union 変換には次の 2 種類があります。

  1. ALL – ALL を適用すると、Union の結果として、重複する行は削除されません。

  2. DISTINCT – DISTINCT を適用すると、Union の結果として、重複する行は削除されます。

Union と Join

行を結合するには Union を使用します。列を結合するには Join を使用します。

Visual ETL キャンバスでの Union 変換の使用
  1. Union 変換を実行するには、複数のデータソースを追加します。データソースを追加するには、リソースパネルを開き、[ソース] タブからデータソースを選択します。Union 変換を使用する前に、Union の対象となるすべてのデータソースのスキーマと構造が同じであることを確認する必要があります。

  2. Union 変換を使用して結合したいデータソースが 2 つ以上ある場合は、キャンバスに追加して Union 変換を作成します。キャンバス上のリソースパネルを開き、「Union」を検索します。リソースパネルの [変換] タブを選択し、Union 変換が見つかるまで下にスクロールして、[Union] を選択することもできます。

  3. ジョブキャンバスの Union ノードを選択します。ノードプロパティウィンドウで、Union 変換に接続する親ノードを選択します。

  4. AWS Glue は互換性をチェックして、Union 変換がすべてのデータソースに適用できることを確認します。データソースのスキーマが同じ場合、実行できます。データソースのスキーマが同じでない場合は、無効であるというエラーメッセージが表示されます。「この Union の入力スキーマは一致していません。ApplyMapping を使用してスキーマを一致させることを検討してください」 これを修正するには、[ApplyMapping を使用] を選択します。

  5. Union の種類を選択します。

    1. All – デフォルトでは、Union の種類として All が選択されています。これにより、データを結合したときに、重複する行は重複したままになります。

    2. Distinct – データを結合したときに、重複する行を削除したい場合は、Distinct を選択します。