Paramètres de tâche de substitution de caractères - AWS Service de Migration de Base de Données

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Paramètres de tâche de substitution de caractères

Vous pouvez spécifier que votre tâche de réplication effectue des substitutions de caractères dans la base de données cible pour toutes les colonnes de la base de données source avec le type de WSTRING données AWS DMS STRING or. Pour en savoir plus sur l’utilisation d’un fichier de configuration de tâche pour définir les paramètres d’une tâche, consultez Exemple de paramètres de tâche.

Vous pouvez configurer la substitution de caractères pour toute tâche avec des points de terminaison provenant des bases de données source et cible suivantes :

  • Bases de données source :

    • Oracle

    • Microsoft SQL Server

    • Mon SQL

    • Poster SQL

    • SAPServeur adaptatif Enterprise (ASE)

    • IBMDB2 LUW

  • Bases de données cible :

    • Oracle

    • Microsoft SQL Server

    • Mon SQL

    • Poster SQL

    • SAPServeur adaptatif Enterprise (ASE)

    • Amazon Redshift

Vous pouvez spécifier des substitutions de caractères à l'aide du paramètre CharacterSetSettings dans vos paramètres de tâche. Ces substitutions de caractères se produisent pour les caractères spécifiés à l'aide de la valeur du point de code Unicode en notation hexadécimale. Vous pouvez implémenter les substitutions en deux phases, dans l'ordre suivant, si les deux sont spécifiées :

  1. Remplacement de caractères individuel : AWS DMS permet de remplacer les valeurs des caractères sélectionnés sur la source par des valeurs de remplacement spécifiées des caractères correspondants sur la cible. Utilisez le tableau CharacterReplacements dans CharacterSetSettings pour sélectionner tous les caractères source ayant les points de code Unicode que vous spécifiez. Utilisez également ce tableau pour spécifier les points de code de remplacement pour les caractères correspondants dans la cible.

    Pour sélectionner tous les caractères de la source qui ont un point de code donné, définissez une instance de SourceCharacterCodePoint dans le tableau CharacterReplacements sur ce point de code. Spécifiez ensuite le point de code de remplacement pour tous les caractères cibles équivalents en définissant l'instance correspondante de TargetCharacterCodePoint dans ce tableau. Pour supprimer les caractères cibles au lieu de les remplacer, définissez les instances appropriées de TargetCharacterCodePoint sur zéro (0). Vous pouvez remplacer ou supprimer autant de valeurs différentes de caractères cibles que vous le souhaitez en spécifiant des paires supplémentaires de paramètres TargetCharacterCodePoint et SourceCharacterCodePoint dans le tableau CharacterReplacements. Si vous spécifiez la même valeur pour plusieurs instances de SourceCharacterCodePoint, la valeur du dernier paramètre correspondant de TargetCharacterCodePoint s'applique à la cible.

    Par exemple, supposons que vous spécifiiez les valeurs suivantes pour CharacterReplacements.

    "CharacterSetSettings": { "CharacterReplacements": [ { "SourceCharacterCodePoint": 62, "TargetCharacterCodePoint": 61 }, { "SourceCharacterCodePoint": 42, "TargetCharacterCodePoint": 41 } ] }

    Dans cet exemple, AWS DMS remplace tous les caractères ayant la valeur hexadécimale du point de code source 62 sur la cible par des caractères ayant la valeur du point de code 61. AWS DMS Remplace également tous les caractères dont le point de code source est 42 sur la cible par des caractères dont le point de code source est 41. En d'autres termes, AWS DMS remplace toutes les instances de la lettre 'b' dans la cible par la lettre 'a'. De même, AWS DMS remplace toutes les instances de la lettre 'B' sur la cible par la lettre'A'.

  2. Validation et remplacement du jeu de caractères : une fois le remplacement de chaque caractère effectué, AWS DMS vous pouvez vous assurer que tous les caractères cibles possèdent des points de code Unicode valides dans le jeu de caractères unique que vous spécifiez. Vous utilisez CharacterSetSupport dans CharacterSetSettings pour configurer cette vérification et cette modification de caractères cibles. Pour spécifier le jeu de caractères de vérification, définissez CharacterSet dans CharacterSetSupport sur la valeur de chaîne du jeu de caractères lui-même. (Les valeurs possibles pour CharacterSet sont indiquées ci-après.) Vous pouvez AWS DMS modifier les caractères cibles non valides de l'une des manières suivantes :

    • Spécifiez un point de code Unicode de remplacement unique pour tous les caractères cibles non valides, quel que soit leur point de code actuel. Pour configurer ce point de code de remplacement, définissez ReplaceWithCharacterCodePoint dans CharacterSetSupport sur la valeur spécifiée.

    • Configurez la suppression de tous les caractères cibles non valides en définissant ReplaceWithCharacterCodePoint sur zéro (0).

    Par exemple, supposons que vous spécifiiez les valeurs suivantes pour CharacterSetSupport.

    "CharacterSetSettings": { "CharacterSetSupport": { "CharacterSet": "UTF16_PlatformEndian", "ReplaceWithCharacterCodePoint": 0 } }

    Dans cet exemple, AWS DMS supprime tous les caractères trouvés sur la cible qui ne sont pas valides dans le jeu de "UTF16_PlatformEndian" caractères. Par conséquent, tous les caractères spécifiés avec la valeur hexadécimale 2FB6 sont supprimés. Cette valeur n'est pas valide car il s'agit d'un point de code Unicode à 4 octets et UTF16 les jeux de caractères n'acceptent que les caractères comportant des points de code à 2 octets.

Note

La tâche de réplication effectue toutes les substitutions de caractères spécifiées avant de commencer les transformations globales ou au niveau de la table que vous avez spécifiées via le mappage de table. Pour plus d'informations sur le mappage de table, consultez la page Utilisation du mappage de table pour spécifier des paramètres de tâche.

La substitution de caractères ne prend pas en charge LOB les types de données. Cela inclut tout type de données DMS considéré comme un type de LOB données. Par exemple, le Extended type de données dans Oracle est considéré comme un. LOB Pour plus d’informations sur les types de données source, consultez Types de données sources pour Oracle ci-après.

Les valeurs prises AWS DMS en charge par CharacterSet apparaissent dans le tableau suivant.

UTF-8 ibm-860_P100-1995 ibm-280_P100-1995
UTF-16 ibm-861_P100-1995 ibm-284_P100-1995
UTF-16BE ibm-862_P100-1995 ibm-285_P100-1995
UTF-16LE ibm-863_P100-1995 ibm-290_P100-1995
UTF-32 ibm-864_X110-1999 ibm-297_P100-1995
UTF-32BE ibm-865_P100-1995 ibm-420_X120-1999
UTF-32LE ibm-866_P100-1995 ibm-424_P100-1995
UTF16_PlatformEndian ibm-867_P100-1998 ibm-500_P100-1995
UTF16_OppositeEndian ibm-868_P100-1995 ibm-803_P100-1999
UTF32_PlatformEndian ibm-869_P100-1995 ibm-838_P100-1995
UTF32_OppositeEndian ibm-878_P100-1996 ibm-870_P100-1995
UTF-16BE,version=1 ibm-901_P100-1999 ibm-871_P100-1995
UTF-16LE,version=1 ibm-902_P100-1999 ibm-875_P100-1995
UTF-16,version=1 ibm-922_P100-1999 ibm-918_P100-1995
UTF-16,version=2 ibm-1168_P100-2002 ibm-930_P120-1999
UTF-7 ibm-4909_P100-1999 ibm-933_P110-1995
IMAP-mailbox-name ibm-5346_P100-1998 ibm-935_P110-1999
SCSU ibm-5347_P100-1998 ibm-937_P110-1999
BOCU-1 ibm-5348_P100-1997 ibm-939_P120-1999
CESU-8 ibm-5349_P100-1998 ibm-1025_P100-1995
ISO-8859-1 ibm-5350_P100-1998 ibm-1026_P100-1995
US-ASCII ibm-9447_P100-2002 ibm-1047_P100-1995
gb18030 ibm-9448_X100-2005 ibm-1097_P100-1995
ibm-912_P100-1995 ibm-9449_P100-2002 ibm-1112_P100-1995
ibm-913_P100-2000 ibm-5354_P100-1998 ibm-1122_P100-1999
ibm-914_P100-1995 ibm-1250_P100-1995 ibm-1123_P100-1995
ibm-915_P100-1995 ibm-1251_P100-1995 ibm-1130_P100-1997
ibm-1089_P100-1995 ibm-1252_P100-2000 ibm-1132_P100-1998
ibm-9005_X110-2007 ibm-1253_P100-1995 ibm-1137_P100-1999
ibm-813_P100-1995 ibm-1254_P100-1995 ibm-4517_P100-2005
ibm-5012_P100-1999 ibm-1255_P100-1995 ibm-1140_P100-1997
ibm-916_P100-1995 ibm-5351_P100-1998 ibm-1141_P100-1997
ibm-920_P100-1995 ibm-1256_P110-1997 ibm-1142_P100-1997
iso-8859_10-1998 ibm-5352_P100-1998 ibm-1143_P100-1997
iso-8859_11-2001 ibm-1257_P100-1995 ibm-1144_P100-1997
ibm-921_P100-1995 ibm-5353_P100-1998 ibm-1145_P100-1997
iso-8859_14-1998 ibm-1258_P100-1997 ibm-1146_P100-1997
ibm-923_P100-1998 macos-0_2-10.2 ibm-1147_P100-1997
ibm-942_P12A-1999 macos-6_2-10.4 ibm-1148_P100-1997
ibm-943_P15A-2003 macos-7_3-10.2 ibm-1149_P100-1997
ibm-943_P130-1999 macos-29-10.2 ibm-1153_P100-1999
ibm-33722_P12A_P12A-2009_U2 macos-35-10.2 ibm-1154_P100-1999
ibm-33722_P120-1999 ibm-1051_P100-1995 ibm-1155_P100-1999
ibm-954_P101-2007 ibm-1276_P100-1995 ibm-1156_P100-1999
euc-jp-2007 ibm-1006_P100-1995 ibm-1157_P100-1999
ibm-1373_P100-2002 ibm-1098_P100-1995 ibm-1158_P100-1999
windows-950-2000 ibm-1124_P100-1996 ibm-1160_P100-1999
ibm-950_P110-1999 ibm-1125_P100-1997 ibm-1164_P100-1999
ibm-1375_P100-2008 ibm-1129_P100-1997 ibm-1364_P110-2007
ibm-5471_P100-2006 ibm-1131_P100-1997 ibm-1371_P100-1999
ibm-1386_P100-2001 ibm-1133_P100-1997 ibm-1388_P103-2001
windows-936-2000 ISO_2022,locale=ja,version=0 ibm-1390_P110-2003
ibm-1383_P110-1999 ISO_2022,locale=ja,version=1 ibm-1399_P110-2003
ibm-5478_P100-1995 ISO_2022,locale=ja,version=2 ibm-5123_P100-1999
euc-tw-2014 ISO_2022,locale=ja,version=3 ibm-8482_P100-1999
ibm-964_P110-1999 ISO_2022,locale=ja,version=4 ibm-16684_P110-2003
ibm-949_P110-1999 ISO_2022,locale=ko,version=0 ibm-4899_P100-1998
ibm-949_P11A-1999 ISO_2022,locale=ko,version=1 ibm-4971_P100-1999
ibm-970_P110_P110-2006_U2 ISO_2022,locale=zh,version=0 ibm-9067_X100-2005
ibm-971_P100-1995 ISO_2022,locale=zh,version=1 ibm-12712_P100-1998
ibm-1363_P11B-1998 ISO_2022,locale=zh,version=2 ibm-16804_X110-1999
ibm-1363_P110-1997 HZ ibm-37_P100-1995,swaplfnl
windows-949-2000 x11-compound-text ibm-1047_P100-1995,swaplfnl
windows-874-2000 ISCII,version=0 ibm-1140_P100-1997,swaplfnl
ibm-874_P100-1995 ISCII,version=1 ibm-1141_P100-1997,swaplfnl
ibm-1162_P100-1999 ISCII,version=2 ibm-1142_P100-1997,swaplfnl
ibm-437_P100-1995 ISCII,version=3 ibm-1143_P100-1997,swaplfnl
ibm-720_P100-1997 ISCII,version=4 ibm-1144_P100-1997,swaplfnl
ibm-737_P100-1997 ISCII,version=5 ibm-1145_P100-1997,swaplfnl
ibm-775_P100-1996 ISCII,version=6 ibm-1146_P100-1997,swaplfnl
ibm-850_P100-1995 ISCII,version=7 ibm-1147_P100-1997,swaplfnl
ibm-851_P100-1995 ISCII,version=8 ibm-1148_P100-1997,swaplfnl
ibm-852_P100-1995 LMBCS-1 ibm-1149_P100-1997,swaplfnl
ibm-855_P100-1995 ibm-37_P100-1995 ibm-1153_P100-1999,swaplfnl
ibm-856_P100-1995 ibm-273_P100-1995 ibm-12712_P100-1998,swaplfnl
ibm-857_P100-1995 ibm-277_P100-1995 ibm-16804_X110-1999,swaplfnl
ibm-858_P100-1997 ibm-278_P100-1995 ebcdic-xml-us