Impostazioni dell'attività di sostituzione dei caratteri - AWS Servizio di migrazione del Database

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Impostazioni dell'attività di sostituzione dei caratteri

È possibile specificare che l'attività di replica esegua sostituzioni di caratteri nel database di destinazione per tutte le colonne del database di origine con il tipo di dati or. AWS DMS STRING WSTRING Per informazioni su come utilizzare un file di configurazione dell'attività per impostare le impostazioni dell'attività, consulta Esempio di impostazioni delle attività.

Puoi configurare la sostituzione dei caratteri per qualsiasi attività con endpoint dai seguenti database di origine e di destinazione:

  • Database di origine:

    • Oracle

    • Microsoft SQL Server

    • Mio SQL

    • Poster SQL

    • SAPAdaptive Server Enterprise () ASE

    • IBMDb2 LUW

  • Database di destinazione:

    • Oracle

    • Microsoft SQL Server

    • Mio SQL

    • Poster SQL

    • SAPAdaptive Server Enterprise () ASE

    • Amazon Redshift

Puoi specificare le sostituzioni dei caratteri utilizzando il parametro CharacterSetSettings nelle impostazioni delle attività. Queste sostituzioni dei caratteri si verificano per i caratteri specificati utilizzando il valore del punto di codice Unicode in notazione esadecimale. Puoi implementare le sostituzioni in due fasi, nel seguente ordine se sono specificate entrambe:

  1. Sostituzione di caratteri individuali: AWS DMS può sostituire i valori dei caratteri selezionati sull'origine con i valori sostitutivi specificati dei caratteri corrispondenti sulla destinazione. Utilizza la matrice CharacterReplacements in CharacterSetSettings per selezionare tutti i caratteri di origine con i punti di codice Unicode specificati. Utilizza questa matrice anche per specificare i punti di codice di sostituzione per i caratteri corrispondenti sulla destinazione.

    Per selezionare tutti i caratteri sull'origine che hanno un determinato punto di codice, imposta un'istanza di SourceCharacterCodePoint nella matrice CharacterReplacements su tale punto di codice. Successivamente, specifica il punto di codice di sostituzione per tutti i caratteri destinazione equivalenti impostando l'istanza corrispondente di TargetCharacterCodePoint in questa matrice. Per eliminare i caratteri di destinazione anziché sostituirli, imposta le istanze appropriate di TargetCharacterCodePoint su zero (0). Puoi sostituire o eliminare tutti i valori diversi di caratteri di destinazione desiderati specificando coppie aggiuntive di impostazioni SourceCharacterCodePoint e TargetCharacterCodePoint nella matrice CharacterReplacements. Se specifichi lo stesso valore per più istanze di SourceCharacterCodePoint, il valore dell'ultima impostazione corrispondente di TargetCharacterCodePoint si applica alla destinazione.

    Ad esempio, supponiamo di specificare i seguenti valori per CharacterReplacements.

    "CharacterSetSettings": { "CharacterReplacements": [ { "SourceCharacterCodePoint": 62, "TargetCharacterCodePoint": 61 }, { "SourceCharacterCodePoint": 42, "TargetCharacterCodePoint": 41 } ] }

    In questo esempio, AWS DMS sostituisce tutti i caratteri con il valore esadecimale 62 del punto di codice sorgente sulla destinazione con caratteri con il valore del punto di codice 61. Inoltre, AWS DMS sostituisce tutti i caratteri con il codice sorgente punto 42 sulla destinazione con caratteri con il valore del punto di codice 41. In altre parole, AWS DMS sostituisce tutte le istanze della lettera 'b' sulla destinazione con la lettera 'a'. Analogamente, AWS DMS sostituisce tutte le istanze della lettera 'B' sulla destinazione con la lettera. 'A'

  2. Convalida e sostituzione del set di caratteri: una volta completata la sostituzione dei singoli caratteri, è AWS DMS possibile verificare che tutti i caratteri di destinazione abbiano punti di codice Unicode validi nel singolo set di caratteri specificato. Puoi utilizzare CharacterSetSupport in CharacterSetSettings per configurare la verifica e la modifica di questo carattere di destinazione. Per specificare il set di caratteri di verifica, imposta CharacterSet in CharacterSetSupport sul valore di stringa del set di caratteri. Di seguito, i possibili valori per CharacterSet. È possibile AWS DMS modificare i caratteri di destinazione non validi in uno dei seguenti modi:

    • Specifica un singolo punto di codice Unicode sostitutivo per tutti i caratteri di destinazione non validi, indipendentemente dal punto di codice corrente. Per configurare questo punto di codice sostitutivo, imposta ReplaceWithCharacterCodePoint in CharacterSetSupport sul valore specificato.

    • Configura l'eliminazione di tutti i caratteri di destinazione non validi impostando ReplaceWithCharacterCodePoint su zero (0).

    Ad esempio, supponiamo di specificare i seguenti valori per CharacterSetSupport.

    "CharacterSetSettings": { "CharacterSetSupport": { "CharacterSet": "UTF16_PlatformEndian", "ReplaceWithCharacterCodePoint": 0 } }

    In questo esempio, AWS DMS elimina tutti i caratteri trovati sulla destinazione che non sono validi nel set di caratteri. "UTF16_PlatformEndian" Pertanto, vengono eliminati tutti i caratteri specificati con il valore esadecimale 2FB6. Questo valore non è valido perché si tratta di un punto di codice Unicode a 4 byte e i set di caratteri accettano solo UTF16 caratteri con punti di codice a 2 byte.

Nota

L'attività di replica completa tutte le sostituzioni dei caratteri specificate prima di avviare qualsiasi trasformazione globale o a livello di tabella specificata tramite la mappatura delle tabelle. Per ulteriori informazioni sulla mappatura delle tabelle, consulta Utilizzo della mappatura delle tabelle per specificare le impostazioni delle attività.

La sostituzione dei caratteri non supporta i tipi di dati. LOB Ciò include qualsiasi tipo di dati che viene DMS considerato un tipo di dati. LOB Ad esempio, il Extended tipo di dati in Oracle è considerato un. LOB Per ulteriori informazioni sui tipi di dati di origine, consulta Tipi di dati di origine per Oracle.

I valori che AWS DMS supportano for sono CharacterSet riportati nella tabella seguente.

UTF-8 ibm-860_P100-1995 ibm-280_P100-1995
UTF-16 ibm-861_P100-1995 ibm-284_P100-1995
UTF-16BE ibm-862_P100-1995 ibm-285_P100-1995
UTF-16LE ibm-863_P100-1995 ibm-290_P100-1995
UTF-32 ibm-864_X110-1999 ibm-297_P100-1995
UTF-32BE ibm-865_P100-1995 ibm-420_X120-1999
UTF-32LE ibm-866_P100-1995 ibm-424_P100-1995
UTF16_PlatformEndian ibm-867_P100-1998 ibm-500_P100-1995
UTF16_OppositeEndian ibm-868_P100-1995 ibm-803_P100-1999
UTF32_PlatformEndian ibm-869_P100-1995 ibm-838_P100-1995
UTF32_OppositeEndian ibm-878_P100-1996 ibm-870_P100-1995
UTF-16BE,version=1 ibm-901_P100-1999 ibm-871_P100-1995
UTF-16LE,version=1 ibm-902_P100-1999 ibm-875_P100-1995
UTF-16,version=1 ibm-922_P100-1999 ibm-918_P100-1995
UTF-16,version=2 ibm-1168_P100-2002 ibm-930_P120-1999
UTF-7 ibm-4909_P100-1999 ibm-933_P110-1995
IMAP-mailbox-name ibm-5346_P100-1998 ibm-935_P110-1999
SCSU ibm-5347_P100-1998 ibm-937_P110-1999
BOCU-1 ibm-5348_P100-1997 ibm-939_P120-1999
CESU-8 ibm-5349_P100-1998 ibm-1025_P100-1995
ISO-8859-1 ibm-5350_P100-1998 ibm-1026_P100-1995
US-ASCII ibm-9447_P100-2002 ibm-1047_P100-1995
gb18030 ibm-9448_X100-2005 ibm-1097_P100-1995
ibm-912_P100-1995 ibm-9449_P100-2002 ibm-1112_P100-1995
ibm-913_P100-2000 ibm-5354_P100-1998 ibm-1122_P100-1999
ibm-914_P100-1995 ibm-1250_P100-1995 ibm-1123_P100-1995
ibm-915_P100-1995 ibm-1251_P100-1995 ibm-1130_P100-1997
ibm-1089_P100-1995 ibm-1252_P100-2000 ibm-1132_P100-1998
ibm-9005_X110-2007 ibm-1253_P100-1995 ibm-1137_P100-1999
ibm-813_P100-1995 ibm-1254_P100-1995 ibm-4517_P100-2005
ibm-5012_P100-1999 ibm-1255_P100-1995 ibm-1140_P100-1997
ibm-916_P100-1995 ibm-5351_P100-1998 ibm-1141_P100-1997
ibm-920_P100-1995 ibm-1256_P110-1997 ibm-1142_P100-1997
iso-8859_10-1998 ibm-5352_P100-1998 ibm-1143_P100-1997
iso-8859_11-2001 ibm-1257_P100-1995 ibm-1144_P100-1997
ibm-921_P100-1995 ibm-5353_P100-1998 ibm-1145_P100-1997
iso-8859_14-1998 ibm-1258_P100-1997 ibm-1146_P100-1997
ibm-923_P100-1998 macos-0_2-10.2 ibm-1147_P100-1997
ibm-942_P12A-1999 macos-6_2-10.4 ibm-1148_P100-1997
ibm-943_P15A-2003 macos-7_3-10.2 ibm-1149_P100-1997
ibm-943_P130-1999 macos-29-10.2 ibm-1153_P100-1999
ibm-33722_P12A_P12A-2009_U2 macos-35-10.2 ibm-1154_P100-1999
ibm-33722_P120-1999 ibm-1051_P100-1995 ibm-1155_P100-1999
ibm-954_P101-2007 ibm-1276_P100-1995 ibm-1156_P100-1999
euc-jp-2007 ibm-1006_P100-1995 ibm-1157_P100-1999
ibm-1373_P100-2002 ibm-1098_P100-1995 ibm-1158_P100-1999
windows-950-2000 ibm-1124_P100-1996 ibm-1160_P100-1999
ibm-950_P110-1999 ibm-1125_P100-1997 ibm-1164_P100-1999
ibm-1375_P100-2008 ibm-1129_P100-1997 ibm-1364_P110-2007
ibm-5471_P100-2006 ibm-1131_P100-1997 ibm-1371_P100-1999
ibm-1386_P100-2001 ibm-1133_P100-1997 ibm-1388_P103-2001
windows-936-2000 ISO_2022,locale=ja,version=0 ibm-1390_P110-2003
ibm-1383_P110-1999 ISO_2022,locale=ja,version=1 ibm-1399_P110-2003
ibm-5478_P100-1995 ISO_2022,locale=ja,version=2 ibm-5123_P100-1999
euc-tw-2014 ISO_2022,locale=ja,version=3 ibm-8482_P100-1999
ibm-964_P110-1999 ISO_2022,locale=ja,version=4 ibm-16684_P110-2003
ibm-949_P110-1999 ISO_2022,locale=ko,version=0 ibm-4899_P100-1998
ibm-949_P11A-1999 ISO_2022,locale=ko,version=1 ibm-4971_P100-1999
ibm-970_P110_P110-2006_U2 ISO_2022,locale=zh,version=0 ibm-9067_X100-2005
ibm-971_P100-1995 ISO_2022,locale=zh,version=1 ibm-12712_P100-1998
ibm-1363_P11B-1998 ISO_2022,locale=zh,version=2 ibm-16804_X110-1999
ibm-1363_P110-1997 HZ ibm-37_P100-1995,swaplfnl
windows-949-2000 x11-compound-text ibm-1047_P100-1995,swaplfnl
windows-874-2000 ISCII,version=0 ibm-1140_P100-1997,swaplfnl
ibm-874_P100-1995 ISCII,version=1 ibm-1141_P100-1997,swaplfnl
ibm-1162_P100-1999 ISCII,version=2 ibm-1142_P100-1997,swaplfnl
ibm-437_P100-1995 ISCII,version=3 ibm-1143_P100-1997,swaplfnl
ibm-720_P100-1997 ISCII,version=4 ibm-1144_P100-1997,swaplfnl
ibm-737_P100-1997 ISCII,version=5 ibm-1145_P100-1997,swaplfnl
ibm-775_P100-1996 ISCII,version=6 ibm-1146_P100-1997,swaplfnl
ibm-850_P100-1995 ISCII,version=7 ibm-1147_P100-1997,swaplfnl
ibm-851_P100-1995 ISCII,version=8 ibm-1148_P100-1997,swaplfnl
ibm-852_P100-1995 LMBCS-1 ibm-1149_P100-1997,swaplfnl
ibm-855_P100-1995 ibm-37_P100-1995 ibm-1153_P100-1999,swaplfnl
ibm-856_P100-1995 ibm-273_P100-1995 ibm-12712_P100-1998,swaplfnl
ibm-857_P100-1995 ibm-277_P100-1995 ibm-16804_X110-1999,swaplfnl
ibm-858_P100-1997 ibm-278_P100-1995 ebcdic-xml-us