AWS Glue を使用した SSISへの変換 AWS SCT - AWS Schema Conversion Tool

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS Glue を使用した SSISへの変換 AWS SCT

を使用して Microsoft SQL Server Integration Services (SSIS) AWS Glue パッケージを に変換する方法を以下に示します AWS SCT。

Microsoft SSISパッケージを に変換するには AWS Glue、 AWS SCT バージョン 1.0.642 以降を使用していることを確認してください。また、ローカルフォルダに .dtsx、、 .conmgr.paramsファイルのETLパッケージを含む SSISプロジェクトが必要です。

サーバーをインストールする必要はありませんSSIS。変換プロセスはローカルSSISファイルを通過します。

AWS Glue を使用して SSISパッケージを に変換するには AWS SCT
  1. で新しいプロジェクトを作成する AWS SCT か、既存のプロジェクトを開きます。詳細については、「でのプロジェクトの開始と管理 AWS SCT」を参照してください。

  2. メニューからソースの追加を選択して、新しいソースSSISパッケージをプロジェクトに追加します。

  3. SQL サーバー統合サービスを選択し、以下を完了します。

    • [接続名] — 接続の名前を入力します。 AWS SCT は、この名前をメタデータツリーに表示します。

    • SSIS packages folder – パッケージを含むSSISプロジェクトフォルダへのパスを選択します。

    AWS SCT は、ローカルフォルダからプロジェクトファイル (拡張子が .dtsx、、.conmgrまたは のファイル.params) を読み取り、解析します。次に、それらをカテゴリの AWS SCT ツリーに整理します。

  4. メニューからターゲットの追加 を選択して、ソースSSISパッケージを変換する新しいターゲットプラットフォームを追加します。

  5. [AWS Glue] を選択して、以下の手順を完了します。

    • [接続名] — 接続の名前を入力します。 AWS SCT は、この名前をメタデータツリーに表示します。

    • AWS プロファイルからコピー – 使用するプロファイルを選択します。

    • AWS アクセスキー – AWS アクセスキーを入力します。

    • AWS シークレットキー – AWS シークレットキーを入力します。

    • リージョン – リストから AWS リージョン 使用する を選択します。

    • [Amazon S3 バケットフォルダ] — 使用する予定の Amazon S3 バケットのフォルダパスを入力します。

    仮想 AWS Glue ターゲットを使用できます。この場合、接続認証情報を指定する必要はありません。詳細については、「の仮想ターゲットへのマッピング AWS Schema Conversion Tool」を参照してください。

  6. ソースSSISパッケージと AWS Glue ターゲットを含む新しいマッピングルールを作成します。詳細については、「での新しいデータ型のマッピング AWS Schema Conversion Tool」を参照してください。

  7. [ビュー] メニューで、[メインビュー] を選択します。

  8. SSIS ツリービューで、接続マネージャー のコンテキスト (右クリック) メニューを開き、接続の設定 を選択します。

  9. プロジェクト接続マネージャを設定します。

    接続マネージャーSSISの接続マッピングを設定するには、対応する AWS Glue 接続マネージャーSSISの接続を指定します。 AWS Glue 接続が既に作成されていることを確認します。

    1. [Connections] (接続) で、[Project connection] (プロジェクト接続) を選択します。

    2. Glue カタログ接続 で、適切な AWS Glue 接続を選択します。

  10. パッケージ接続マネージャを設定します。

    1. [接続] で、パッケージを選択します。

    2. Glue カタログ接続 で、適切な AWS Glue 接続を選択します。

    3. パッケージで使用可能なすべての接続について、これらのアクションを繰り返します。

  11. [Apply] を選択します。

  12. パッケージを変換します。ソースツリービューで、[パッケージ] を探します。パッケージのコンテキスト (右クリック) メニューを開き、[パッケージの変換] を選択します。

  13. 変換されたスクリプトを Amazon S3 に保存します。ターゲットのツリービューで、[パッケージスクリプト] を見つけます。変換されたスクリプトのコンテキスト (右クリック) メニューを開き、[S3 に保存] を選択します。

  14. AWS Glue ジョブを設定します。ターゲットのツリービューで、[Package スクリプト] を見つけます。変換したスクリプトのコンテキスト (右クリック) メニューを開き、 AWS Glue ジョブ の設定 を選択します。

  15. 次に示す、3 つの設定セクションを完了します。

    1. [デザインデータフロー] セクションに入力します。

      • 実行戦略 — ジョブがETLスクリプトを実行する方法を選択します。ウィザードで指定された順序でスクリプトSEQUENTIALを実行することを選択します。ウィザードで指定された順序を無視PARALLELして、スクリプトを並行して実行することを選択します。

      • [スクリプト] — 変換したスクリプトの名前を選択します。

      • [次へ] をクリックします。

    2. [Job プロパティ]セクションに入力します。

      • 名前 – AWS Glue ジョブの名前を入力します。

      • IAM ロール — ジョブの実行とデータストアへのアクセスに使用されるリソースの承認に使用されるIAMロールを選択します。

      • [スクリプトファイル名] — 変換したスクリプトの名前を入力します。

      • [スクリプトファイル S3 パス] — 変換されたスクリプトへの Amazon S3 パスを入力します。

      • SSE-S3 を使用してスクリプトを暗号化する – Amazon S3 がS3-managed暗号化を使用してデータを保護するには、このオプションを選択しますSSE-S3。

      • 一時ディレクトリ – 中間結果の一時ディレクトリへの Amazon S3 パスを入力します。 AWS Glue AWS Glue 組み込み変換は、このディレクトリを使用して Amazon Redshift に読み書きします。

      • AWS SCT は Python ライブラリのパスを自動的に生成します。このパスは [生成された Python ライブラリパス] で確認できます。この自動生成されたパスは編集できません。追加の Python ライブラリを使用するには、[ユーザ Python ライブラリパス] にパスを入力します。

      • [ユーザ Python ライブラリパス] — 追加のユーザ Python ライブラリのパスを入力します。Amazon S3 のパスはカンマで区切ります。

      • [依存 jars ファイルのパス] – 依存 .jars ファイルのパスを入力します。Amazon S3 のパスはカンマで区切ります。

      • [参照ファイルパス] — 設定ファイルなど、スクリプトに必要な追加ファイルのパスを入力します。Amazon S3 のパスはカンマで区切ります。

      • 最大容量 – このジョブの実行時に割り当てることができるデータ処理ユニット (DPUs) の最大数 AWS Glue を入力します。2 から 100 の任意の整数を入力できます。デフォルトは 2 です。

      • [同時実行の最大数] – このジョブで許可される同時実行の最大数を設定します。デフォルトは 1 です。このしきい値に達するとエラー AWS Glue が返されます。

      • ジョブタイムアウト (分) – ランナウェイETLジョブに対する保護として、ジョブのタイムアウト値を入力します。バッチジョブのデフォルト値は 2880 分 (48 時間) です。ジョブがこの制限を超えると、ジョブの実行状態は TIMEOUT に変わります。

      • 遅延通知しきい値 (分) — が遅延通知 AWS SCT を送信する前に、しきい値を分単位で入力します。

      • 再試行回数 – ジョブが失敗した場合に が自動的に再起動 AWS Glue する回数 (0~10) を入力します。タイムアウト制限に達したジョブは再起動されません。デフォルトは 0 です。

      • [Next (次へ)] を選択します。

    3. 必要な接続を設定します。

      1. すべての接続 から必要な AWS Glue 接続を選択し、選択した接続 のリストに追加します。

      2. [Finish] を選択します。

  16. 設定済みの AWS Glue ジョブを作成します。ターゲットツリービューで、ETLジョブ を検索して展開します。設定したETLジョブのコンテキスト (右クリック) メニューを開き、 AWS Glue ジョブの作成 を選択します。

  17. AWS Glue ジョブを実行します。

    1. で AWS Glue コンソールを開きますhttps://console.aws.amazon.com/glue/

    2. ナビゲーションペインで ジョブを選択します。

    3. [ジョブの追加] タブで、実行するジョブを選択します。

    4. [Action] (アクション) タブで、[Run job] (ジョブの実行) を選択します。

SSIS に変換 AWS SCT できる コンポーネント AWS Glue

を使用して AWS SCT 、データフローと制御フローコンポーネント、コンテナ、パラメータ、変数を変換できます。

サポートされるデータフローコンポーネントは次のとおりです。

  • ADO NET 送信先

  • ADO NET ソース

  • 集計

  • キャッシュ変換

  • キャラクタマップ変換

  • 条件付き分割変換

  • コピー列変換

  • データ変換

  • 派生列変換

  • Excel 送信先

  • Excel 送信元

  • エクスポート列変換

  • フラットファイル送信先

  • フラットファイルソース

  • ファジー検索変換

  • インポート列変換

  • 参照変換

  • マージ結合変換

  • マージ変換

  • マルチキャスト変換

  • ODBC 送信先

  • ODBC ソース

  • OLE DB コマンド変換

  • OLE DB 送信先

  • OLE DB ソース

  • パーセンテージサンプリング変換

  • ピボット変換

  • raw ファイル送信先

  • raw ファイル送信元

  • RecordSet 送信先

  • 行数変換

  • 行サンプリング変換

  • ソート変換

  • SQL サーバーの送信先

  • Union All 変換

  • ピボット解除変換

  • XML ソース

サポートされている制御フローコンポーネントは以下のとおりです。

  • 一括挿入タスク

  • パッケージ実行タスク

  • SQL タスクの実行

  • T SQLステートメントタスクの実行

  • 式タスク

  • ファイルシステムタスク

  • オペレーター通知タスク

  • メール送信タスク

サポートされているSSISコンテナは次のとおりです。

  • ループコンテナ用

  • Foreach ループコンテナ

  • シーケンスコンテナ