翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
AWS Glue Studio でSSISパッケージを に変換する AWS Schema Conversion Tool
を使用して AWS SCT 、Microsoft SQL Server Integration Services (SSIS) パッケージを に変換できます AWS Glue Studio。
SSIS パッケージには、特定の抽出、変換、ロード (ETL) タスクを実行するために必要な、接続マネージャー、タスク、制御フロー、データフロー、パラメータ、イベントハンドラー、変数などのコンポーネントが含まれています。 AWS SCT はSSISパッケージを と互換性のある形式に変換します AWS Glue Studio。ソースデータベースを に移行したら AWS クラウド、変換されたこれらの AWS Glue Studio ジョブを実行してETLタスクを実行できます。
Microsoft SSISパッケージを に変換するには AWS Glue Studio、必ず AWS SCT バージョン 1.0.661 以降を使用してください。
トピック
前提条件
このセクションでは、SSISパッケージを に変換するための前提条件タスクについて説明します AWS Glue。これらのタスクには、アカウントで必要な AWS リソースの作成が含まれます。
AWS Identity and Access Management (IAM) を使用して、 が AWS Glue Studio 使用する リソースへのアクセスに必要なポリシーとロールを定義できます。詳細については、IAM AWS Glue Studio 「 ユーザー のアクセス許可」を参照してください。
がソーススクリプトを AWS SCT に変換したら AWS Glue Studio、変換されたスクリプトを Amazon S3 バケットにアップロードします。この Amazon S3 バケットは必ず作成し、 AWS サービスプロファイル設定で選択してください。Amazon S3 バケットの作成の詳細については、『Amazon Simple Storage Service ユーザーガイド』の「最初の S3 バケットの作成」を参照してください。
がデータストアに接続 AWS Glue Studio できるようにするには、カスタムコネクタと接続を作成します。また、データベース認証情報を に保存します AWS Secrets Manager。
カスタムコネクタを作成するには
-
データストアのJDBCドライバーをダウンロードします。が AWS SCT 使用するJDBCドライバーの詳細については、「」を参照してくださいのJDBCドライバーのインストール AWS Schema Conversion Tool。
-
このドライバーを Amazon S3 バケットにアップロードします。詳細については、『Amazon Simple Storage Service ユーザーガイド』の「バケットへのオブジェクトのアップロード」を参照してください。
-
にサインイン AWS Management Console し、 で AWS Glue Studio コンソールを開きますhttps://console.aws.amazon.com/gluestudio/
。 -
[コネクタ] を選択し、[カスタムコネクタの作成] を選択します。
-
Connector S3 URLで S3 を参照 を選択し、Amazon S3 バケットにアップロードしたJDBCドライバーファイルを選択します。
-
コネクタのわかりやすい [名前] を入力します。たとえば、
SQLServer
と入力します。 -
コネクタタイプ で、 を選択しますJDBC。
-
クラス名 に、JDBCドライバーのメインクラスの名前を入力します。SQL Server には、 と入力します
com.microsoft.sqlserver.jdbc.SQLServerDriver
。 -
JDBC URL ベース には、JDBCベース を入力しますURL。JDBC ベースの構文は、ソースデータベースエンジンURLによって異なります。Server の場合SQL、次の形式を使用します:
jdbc:sqlserver://$
。<host>
:$<port>
;databaseName=$<dbname>
;user=$<username>
;password=$<password>
必ず を置き換えてください。
<host>
,<port>
,<dbname>
,<username>
および<password>
を自分の値で使用します。 -
URL パラメータ区切り文字 には、セミコロン () を入力します
;
。 -
[コネクターを作成] をクリックします。
データベース認証情報を に保存するには AWS Secrets Manager
にサインイン AWS Management Console し、 で AWS Secrets Manager コンソールを開きますhttps://console.aws.amazon.com/secretsmanager/
。 -
[新しいシークレットを保存] を選択します。
-
[Choose secret type] (シークレットタイプを選択する) ページで、次の操作を行います。
-
[シークレットタイプ] で、[他の種類のシークレット] を選択します。
-
[キー/値ペア] () で、
host
、port
、dbname
、username
、password
のキーを入力します。次に、これらのキーの値を入力します。
-
-
[シークレットの設定] ページで、わかりやすい [シークレット名] を入力します。たとえば、
SQL_Server_secret
と入力します。 -
[Next (次へ)] を選択します。[自動回転の設定] ページで、[次へ] を選択します。
-
[Review] (レビュー) ページで、シークレットの詳細を確認し、[Store] (保存) を選択します。
コネクタ用に接続を作成するには
にサインイン AWS Management Console し、 で AWS Glue Studio コンソールを開きますhttps://console.aws.amazon.com/gluestudio/
。 -
接続を作成するコネクタを選択し、[接続の作成] をクリックします。
-
[接続の作成] ページで、接続のわかりやすい [名前]、およびその説明を入力します。たとえば、
SQL-Server-connection
と入力します。 -
AWS シークレット で、 で作成したシークレットを選択します AWS Secrets Manager。
-
[ネットワークオプション] を設定し、[接続の作成] を選択します。
これで、カスタムコネクタを使用して AWS Glue Studio ジョブを作成できます。詳細については、「 AWS Glue Studio ジョブの作成」を参照してください。
AWS SCT プロジェクトへのSSISパッケージの追加
1 つの AWS SCT プロジェクトに複数のSSISパッケージを追加できます。
AWS SCT プロジェクトに SSISパッケージを追加するには
-
で新しいプロジェクトを作成する AWS SCT か、既存のプロジェクトを開きます。詳細については、「でのプロジェクトの開始と管理 AWS SCT」を参照してください。
-
メニューからソースの追加を選択し、SQLサーバー統合サービス を選択します。
-
接続名 にパッケージの名前を入力しますSSIS。 AWS SCT は左側のパネルのツリーにこの名前を表示します。
-
SSIS パッケージフォルダ には、ソースSSISパッケージを含むフォルダへのパスを入力します。
-
メニューから、[ターゲットの追加]、[AWS Glue Studio] の順に選択します。
に接続するには AWS Glue Studio、 AWS プロファイル AWS SCT を使用します。詳細については、「でのプロファイルの管理 AWS Schema Conversion Tool」を参照してください。
-
ソースSSISパッケージと AWS Glue Studio ターゲットを含むマッピングルールを作成します。詳細については、「でのデータ型のマッピング AWS Schema Conversion Tool」を参照してください。
-
AWS Glue Studio コンソールで AWS Glue Studio 接続を作成します。詳細については、「コネクタ用の接続を作成する」を参照してください。
-
左側のツリーで [接続マネージャ] コンテキスト (右クリック) メニューを開き、[接続の設定] を選択します。
AWS SCT 接続の設定ウィンドウが表示されます。
-
ソースSSIS接続ごとに、 AWS Glue Studio 接続を選択します。
AWS Glue Studio を使用したSSISパッケージの への変換 AWS SCT
以下では、 AWS Glue Studio を使用してSSISパッケージを に変換する方法について説明します AWS SCT。
SSIS パッケージを に変換するには AWS Glue Studio
-
SSIS パッケージを AWS SCT プロジェクトに追加します。詳細については、「 AWS SCT プロジェクトへのSSISパッケージの追加」を参照してください。
-
左側のパネルで、 ETLおよび SSISノードを展開します。
-
[パッケージ] を選択し、コンテキスト (右クリック) メニューを開いてから、[パッケージの変換] を選択します。
AWS SCT は、選択したSSISパッケージを JSON ファイルに変換します。これらのJSONオブジェクトは、有向非巡回グラフ () のノードを表しますDAG。変換したファイルは、右側のツリーのパッケージDAGsノードで検索します。
-
パッケージ DAGsを選択し、コンテキスト (右クリック) メニューを開き、Amazon S3 に保存 を選択します。
これで、これらのスクリプトを使用して AWS Glue Studioでジョブを作成できます。
変換されたコードを使用した AWS Glue Studio ジョブの作成
ソースSSISパッケージを変換したら、変換されたJSONファイルを使用して AWS Glue Studio ジョブを作成できます。
AWS Glue Studio ジョブを作成するには
-
右側のツリーでパッケージDAGsを選択し、コンテキスト (右クリック) メニューを開き、 AWS Glue Studio ジョブの設定 を選択します。
-
(オプション) でSSIS関数をエミュレートする拡張パックを適用します AWS Glue Studio。
-
AWS Glue Studio ジョブの設定ウィンドウが開きます。
[基本ジョブのプロパティ] セクションに必要事項を入力します。
[名前] — AWS Glue Studio ジョブの名前を入力します。
[スクリプトファイル名] — ジョブスクリプトの名前を入力します。
[パラメータの追加] を選択し、その値を入力します。
[次へ] をクリックします。
-
[アドバンスジョブのプロパティ] セクションに必要事項を入力します。
-
IAM ロール — データストアへの承認 AWS Glue Studio とアクセスに使用されるIAMロールを選択します。
-
[スクリプトファイル S3 パス] — 変換されたスクリプトへの Amazon S3 パスを入力します。
-
一時ディレクトリ – 中間結果の一時ディレクトリへの Amazon S3 パスを入力します。 はこのディレクトリ AWS Glue Studio を使用して Amazon Redshift に読み書きします。
-
AWS SCT は Python ライブラリのパスを自動的に生成します。このパスは [生成された Python ライブラリパス] で確認できます。この自動生成されたパスは編集できません。追加の Python ライブラリを使用するには、[ユーザ Python ライブラリパス] にパスを入力します。
-
[ユーザ Python ライブラリパス] — 追加のユーザ Python ライブラリのパスを入力します。Amazon S3 のパスはカンマで区切ります。
-
[依存 jars パス] – 依存
*.jar
ファイルのパスを入力します。Amazon S3 のパスはカンマで区切ります。 -
[参照ファイルパス] — 設定ファイルなど、スクリプトに必要な追加ファイルのパスを入力します。Amazon S3 のパスはカンマで区切ります。
-
[ワーカータイプ] —
G.1X
またはG.2X
を選択します。G.1X
各ワーカーを選択すると、 は 1 DPU (4 v CPU、16 GB のメモリ、64 GB のディスク) にマッピングされます。G.2X
各ワーカーを選択すると、2 DPU (8 v CPU、32 GB のメモリ、128 GB のディスク) にマッピングされます。 -
[要求されたワーカー数] — ジョブの実行時に割り当てられるワーカーの数を入力します。
-
[同時実行の最大数] – このジョブで許可される同時実行の最大数を設定します。デフォルトは 1 です。このしきい値に達するとエラー AWS Glue が返されます。
-
ジョブタイムアウト (分) – ランナウェイETLジョブに対する保護として、ジョブのタイムアウト値を入力します。バッチジョブのデフォルト値は 2,880 分 (48 時間) です。ジョブがこの制限を超えると、ジョブの実行状態は
TIMEOUT
に変わります。 -
遅延通知しきい値 (分) — が遅延通知 AWS SCT を送信する前に、しきい値を分単位で入力します。
-
再試行回数 – ジョブが失敗した場合に が自動的に再起動 AWS Glue する回数 (0~10) を入力します。タイムアウト制限に達したジョブは再起動されません。デフォルトは 0 です。
[終了] を選択します。
AWS SCT は、選択した AWS Glue Studio ジョブを設定します。
-
-
設定済みジョブは、右側のツリーのETLジョブで検索します。設定したジョブを選択し、コンテキスト (右クリック) メニューを開き、 AWS Glue Studio ジョブの作成 を選択します。
-
[適用ステータス] を選択し、ジョブの [ステータス] の値が [成功] であることを確認します。
-
AWS Glue Studio コンソールを開き、更新 を選択し、ジョブを選択します。その後、[Run] (実行) をクリックします。
を使用した SSISパッケージの評価レポートの作成 AWS SCT
ETL 移行評価レポートには、SSISパッケージを と互換性のある形式に変換する方法に関する情報が記載されています AWS Glue Studio。評価レポートには、SSISパッケージのコンポーネントのアクション項目が含まれます。これらのアクション項目は、どのコンポーネントが自動的に変換できない AWS SCT かを示します。
ETL 移行評価レポートを作成するには
-
左パネルの ETLの下にSSISノードを展開します。
-
[パッケージ] を選択して オブジェクトのコンテキスト (右クリック) メニューを開き、[レポートを作成] を選択します。
-
[概要] タブを表示します。ここでは、ETL移行評価レポートのエグゼクティブサマリー情報 AWS SCT が表示されます。これには、SSISパッケージのすべてのコンポーネントの変換結果が含まれます。
-
(オプション) ETL移行評価レポートのローカルコピーを PDF ファイルまたはカンマ区切り値 (CSV) ファイルとして保存します。
-
ETL 移行評価レポートをPDFファイルとして保存するには、右上の に保存する PDF を選択します。
PDF ファイルには、エグゼクティブサマリー、アクション項目、スクリプト変換のレコメンデーションが含まれています。
-
ETL 移行評価レポートをCSVファイルとして保存するには、右上CSVの に保存する を選択します。
AWS SCT は 3 つのCSVファイルを作成します。これらのファイルには、アクション項目、推奨アクション、およびスクリプトの変換に必要な推定手作業の複雑さが含まれています。
-
-
[アクション項目] タブを選択します。このタブには、 への手動変換が必要な項目のリストが含まれています AWS Glue Studio。リストからアクション項目を選択すると、 はアクション項目が適用されるソースSSISパッケージの項目 AWS SCT を強調表示します。
SSIS に変換 AWS SCT できる コンポーネント AWS Glue Studio
を使用して AWS SCT 、SSISデータフローのコンポーネントとパラメータを に変換できます AWS Glue Studio。
サポートされるデータフローコンポーネントは次のとおりです。
ADO NET 送信先
ADO NET ソース
集計
文字マップ
条件付き分割
コピー列
データ変換
派生カラム
検索
マージ
マージ結合
マルチキャスト
ODBCDestination
ODBCSource
OLEDBDestination
OLEDBSource
行数
並べ替え
SQL サーバーの送信先
Union All
AWS SCT はより多くのSSISコンポーネントを に変換できます AWS Glue。詳細については、「SSIS に変換 AWS SCT できる コンポーネント AWS Glue」を参照してください。