文字置換タスクの設定 - AWS データベース移行サービス

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

文字置換タスクの設定

レプリケーションタスクが、 STRINGまたは WSTRING データ型のすべてのソースデータベース列のターゲットデータベースで文字置換を実行するように AWS DMS 指定できます。タスク設定ファイルを使用してタスク設定を設定する方法については、「タスク設定例」をご参照ください。

次のソースデータベースとターゲットデータベースからのエンドポイントを持つ任意のタスクの文字置換を設定できます。

  • ソースデータベース。

    • Oracle

    • Microsoft SQL サーバー

    • マイSQL

    • PostgreSQL

    • SAP アダプティブサーバーエンタープライズ (ASE)

    • IBM Db2 LUW

  • ターゲットデータベース:

    • Oracle

    • Microsoft SQL サーバー

    • マイSQL

    • PostgreSQL

    • SAP アダプティブサーバーエンタープライズ (ASE)

    • Amazon Redshift

タスク設定の CharacterSetSettings パラメータを使用して、文字置換を指定できます。これらの文字置換は、16 進数表記の Unicode コードポイント値を使用して指定された文字に対して発生します。両方が指定されている場合は、2 つのフェーズで置換を実装できます。

  1. 個々の文字置換 — ソース上の選択した文字の値を、ターゲット上の対応する文字の指定された置換値に置き換え AWS DMS ることができます。CharacterSetSettingsCharacterReplacements 配列を使用して、指定した Unicode コードポイントを持つすべてのソース文字を選択します。また、この配列を使用して、ターゲットの対応する文字の置換コードポイントを指定します。

    特定のコードポイントを持つソースのすべての文字を選択するには、CharacterReplacements 配列の SourceCharacterCodePoint のインスタンスをそのコードポイントに設定します。次に、この配列で TargetCharacterCodePoint の対応するインスタンスを設定することで、すべての同等のターゲット文字の置換コードポイントを指定します。ターゲットキャラクターを置き換えるのではなく削除するには、TargetCharacterCodePoint の適切なインスタンスをゼロ (0) に設定します。CharacterReplacements 配列で SourceCharacterCodePoint 設定と TargetCharacterCodePoint 設定の追加のペアを指定することで、必要な数のターゲットキャラクターの値を置換または削除できます。SourceCharacterCodePoint の複数のインスタンスに同じ値を指定した場合、対応する最後の TargetCharacterCodePoint の設定の値がターゲットに適用されます。

    例えば、CharacterReplacements に次の値を指定するとします。

    "CharacterSetSettings": { "CharacterReplacements": [ { "SourceCharacterCodePoint": 62, "TargetCharacterCodePoint": 61 }, { "SourceCharacterCodePoint": 42, "TargetCharacterCodePoint": 41 } ] }

    この例では、 はすべての文字をターゲットのソースコードポイント 16 進値 62 に、コードポイント値 61 の文字 AWS DMS に置き換えます。また、 は、すべての文字をターゲットのソースコードポイント 42 に、コードポイント値 41 の文字 AWS DMS に置き換えます。つまり、 AWS DMS は、ターゲット上の文字 'b' のすべてのインスタンスを文字 'a' で置き換えます。同様に、 AWS DMS はターゲット上の文字のすべてのインスタンス'B'を文字 に置き換えます'A'

  2. 文字セットの検証と置換 — 個々の文字置換が完了したら、指定した 1 文字セットにすべてのターゲット文字の有効な Unicode コードポイントがあることを確認 AWS DMS できます。CharacterSetSettingsCharacterSetSupport を使用して、このターゲットキャラクターの検証と変更を設定します。検証文字セットを指定するには、CharacterSetSupportCharacterSet を文字セットの文字列値に設定します。(指定できる値については、CharacterSetを参照してください) 次のいずれかの方法で、無効なターゲット文字を で AWS DMS 変更できます。

    • 現在のコードポイントに関係なく、すべての無効なターゲット文字に対して 1 つの置換 Unicode コードポイントを指定します。この置換コードポイントを設定するには、CharacterSetSupportReplaceWithCharacterCodePoint を指定された値に設定します。

    • ReplaceWithCharacterCodePoint をゼロ (0) に設定して、すべての無効なターゲット文字の削除を設定します。

    例えば、CharacterSetSupport に次の値を指定するとします。

    "CharacterSetSettings": { "CharacterSetSupport": { "CharacterSet": "UTF16_PlatformEndian", "ReplaceWithCharacterCodePoint": 0 } }

    この例では、 は、ターゲットで見つかった文字のうち、文字セットで無効な"UTF16_PlatformEndian"文字をすべて AWS DMS 削除します。したがって、16 進値で指定された文字 2FB6 はすべて削除されます。この値は無効です。これは 4 バイトの Unicode コードポイントであり、UTF16文字セットは 2 バイトのコードポイントを持つ文字のみを受け入れるためです。

注記

レプリケーションタスクは、テーブルマッピングで指定したグローバルまたはテーブルレベルの変換を開始する前に、指定されたすべての文字置換を完了します。テーブルマッピングの詳細については、「テーブルマッピングを使用して、タスクの設定を指定する」をご参照ください。

文字置換はLOBデータ型をサポートしていません。これには、 がデータ型DMSと見なすすべてのLOBデータ型が含まれます。例えば、Oracle Extendedのデータ型は と見なされますLOB。ソースデータ型の詳細については、次の「Oracle のソースデータ型」を参照してください。

が に対して AWS DMS サポートする値は、次の表CharacterSetのとおりです。

UTF-8 ibm-860_P100-1995 ibm-280_P100-1995
UTF-16 ibm-861_P100-1995 ibm-284_P100-1995
UTF-16BE ibm-862_P100-1995 ibm-285_P100-1995
UTF-16LE ibm-863_P100-1995 ibm-290_P100-1995
UTF-32 ibm-864_X110-1999 ibm-297_P100-1995
UTF-32BE ibm-865_P100-1995 ibm-420_X120-1999
UTF-32LE ibm-866_P100-1995 ibm-424_P100-1995
UTF16_PlatformEndian ibm-867_P100-1998 ibm-500_P100-1995
UTF16_OppositeEndian ibm-868_P100-1995 ibm-803_P100-1999
UTF32_PlatformEndian ibm-869_P100-1995 ibm-838_P100-1995
UTF32_OppositeEndian ibm-878_P100-1996 ibm-870_P100-1995
UTF-16BE,version=1 ibm-901_P100-1999 ibm-871_P100-1995
UTF-16LE,version=1 ibm-902_P100-1999 ibm-875_P100-1995
UTF-16,version=1 ibm-922_P100-1999 ibm-918_P100-1995
UTF-16,version=2 ibm-1168_P100-2002 ibm-930_P120-1999
UTF-7 ibm-4909_P100-1999 ibm-933_P110-1995
IMAP-mailbox-name ibm-5346_P100-1998 ibm-935_P110-1999
SCSU ibm-5347_P100-1998 ibm-937_P110-1999
BOCU-1 ibm-5348_P100-1997 ibm-939_P120-1999
CESU-8 ibm-5349_P100-1998 ibm-1025_P100-1995
ISO-8859-1 ibm-5350_P100-1998 ibm-1026_P100-1995
US-ASCII ibm-9447_P100-2002 ibm-1047_P100-1995
gb18030 ibm-9448_X100-2005 ibm-1097_P100-1995
ibm-912_P100-1995 ibm-9449_P100-2002 ibm-1112_P100-1995
ibm-913_P100-2000 ibm-5354_P100-1998 ibm-1122_P100-1999
ibm-914_P100-1995 ibm-1250_P100-1995 ibm-1123_P100-1995
ibm-915_P100-1995 ibm-1251_P100-1995 ibm-1130_P100-1997
ibm-1089_P100-1995 ibm-1252_P100-2000 ibm-1132_P100-1998
ibm-9005_X110-2007 ibm-1253_P100-1995 ibm-1137_P100-1999
ibm-813_P100-1995 ibm-1254_P100-1995 ibm-4517_P100-2005
ibm-5012_P100-1999 ibm-1255_P100-1995 ibm-1140_P100-1997
ibm-916_P100-1995 ibm-5351_P100-1998 ibm-1141_P100-1997
ibm-920_P100-1995 ibm-1256_P110-1997 ibm-1142_P100-1997
iso-8859_10-1998 ibm-5352_P100-1998 ibm-1143_P100-1997
iso-8859_11-2001 ibm-1257_P100-1995 ibm-1144_P100-1997
ibm-921_P100-1995 ibm-5353_P100-1998 ibm-1145_P100-1997
iso-8859_14-1998 ibm-1258_P100-1997 ibm-1146_P100-1997
ibm-923_P100-1998 macos-0_2-10.2 ibm-1147_P100-1997
ibm-942_P12A-1999 macos-6_2-10.4 ibm-1148_P100-1997
ibm-943_P15A-2003 macos-7_3-10.2 ibm-1149_P100-1997
ibm-943_P130-1999 macos-29-10.2 ibm-1153_P100-1999
ibm-33722_P12A_P12A-2009_U2 macos-35-10.2 ibm-1154_P100-1999
ibm-33722_P120-1999 ibm-1051_P100-1995 ibm-1155_P100-1999
ibm-954_P101-2007 ibm-1276_P100-1995 ibm-1156_P100-1999
euc-jp-2007 ibm-1006_P100-1995 ibm-1157_P100-1999
ibm-1373_P100-2002 ibm-1098_P100-1995 ibm-1158_P100-1999
windows-950-2000 ibm-1124_P100-1996 ibm-1160_P100-1999
ibm-950_P110-1999 ibm-1125_P100-1997 ibm-1164_P100-1999
ibm-1375_P100-2008 ibm-1129_P100-1997 ibm-1364_P110-2007
ibm-5471_P100-2006 ibm-1131_P100-1997 ibm-1371_P100-1999
ibm-1386_P100-2001 ibm-1133_P100-1997 ibm-1388_P103-2001
windows-936-2000 ISO_2022,locale=ja,version=0 ibm-1390_P110-2003
ibm-1383_P110-1999 ISO_2022,locale=ja,version=1 ibm-1399_P110-2003
ibm-5478_P100-1995 ISO_2022,locale=ja,version=2 ibm-5123_P100-1999
euc-tw-2014 ISO_2022,locale=ja,version=3 ibm-8482_P100-1999
ibm-964_P110-1999 ISO_2022,locale=ja,version=4 ibm-16684_P110-2003
ibm-949_P110-1999 ISO_2022,locale=ko,version=0 ibm-4899_P100-1998
ibm-949_P11A-1999 ISO_2022,locale=ko,version=1 ibm-4971_P100-1999
ibm-970_P110_P110-2006_U2 ISO_2022,locale=zh,version=0 ibm-9067_X100-2005
ibm-971_P100-1995 ISO_2022,locale=zh,version=1 ibm-12712_P100-1998
ibm-1363_P11B-1998 ISO_2022,locale=zh,version=2 ibm-16804_X110-1999
ibm-1363_P110-1997 HZ ibm-37_P100-1995,swaplfnl
windows-949-2000 x11-compound-text ibm-1047_P100-1995,swaplfnl
windows-874-2000 ISCII,version=0 ibm-1140_P100-1997,swaplfnl
ibm-874_P100-1995 ISCII,version=1 ibm-1141_P100-1997,swaplfnl
ibm-1162_P100-1999 ISCII,version=2 ibm-1142_P100-1997,swaplfnl
ibm-437_P100-1995 ISCII,version=3 ibm-1143_P100-1997,swaplfnl
ibm-720_P100-1997 ISCII,version=4 ibm-1144_P100-1997,swaplfnl
ibm-737_P100-1997 ISCII,version=5 ibm-1145_P100-1997,swaplfnl
ibm-775_P100-1996 ISCII,version=6 ibm-1146_P100-1997,swaplfnl
ibm-850_P100-1995 ISCII,version=7 ibm-1147_P100-1997,swaplfnl
ibm-851_P100-1995 ISCII,version=8 ibm-1148_P100-1997,swaplfnl
ibm-852_P100-1995 LMBCS-1 ibm-1149_P100-1997,swaplfnl
ibm-855_P100-1995 ibm-37_P100-1995 ibm-1153_P100-1999,swaplfnl
ibm-856_P100-1995 ibm-273_P100-1995 ibm-12712_P100-1998,swaplfnl
ibm-857_P100-1995 ibm-277_P100-1995 ibm-16804_X110-1999,swaplfnl
ibm-858_P100-1997 ibm-278_P100-1995 ebcdic-xml-us