Pengaturan tugas substitusi karakter - AWS Layanan Migrasi Database

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pengaturan tugas substitusi karakter

Anda dapat menentukan bahwa tugas replikasi Anda melakukan substitusi karakter pada database target untuk semua kolom database sumber dengan AWS DMS STRING atau WSTRING tipe data. Untuk informasi tentang cara menggunakan file konfigurasi tugas untuk mengatur setelan tugas, lihatContoh pengaturan tugas.

Anda dapat mengkonfigurasi substitusi karakter untuk setiap tugas dengan endpoint dari sumber dan target database berikut:

  • Database sumber:

    • Oracle

    • SQLServer Microsoft

    • Saya SQL

    • Postgre SQL

    • SAPPerusahaan Server Adaptif () ASE

    • IBMDb2 LUW

  • Basisdata target:

    • Oracle

    • SQLServer Microsoft

    • Saya SQL

    • Postgre SQL

    • SAPPerusahaan Server Adaptif () ASE

    • Amazon Redshift

Anda dapat menentukan substitusi karakter menggunakan parameter CharacterSetSettings dalam pengaturan tugas Anda. Substitusi karakter ini terjadi untuk karakter yang ditentukan menggunakan nilai titik kode Unicode dalam notasi heksadesimal. Anda dapat menerapkan substitusi dalam dua tahap, dalam urutan berikut jika keduanya ditentukan:

  1. Penggantian karakter individu - AWS DMS dapat mengganti nilai karakter yang dipilih pada sumber dengan nilai pengganti yang ditentukan dari karakter yang sesuai pada target. Gunakan susunan CharacterReplacements dalam CharacterSetSettings untuk memilih semua karakter sumber yang memiliki poin kode Unicode yang Anda tentukan. Gunakan susunan ini juga untuk menentukan poin kode pengganti untuk karakter yang sesuai pada target.

    Untuk memilih semua karakter pada sumber yang memiliki titik kode tertentu, atur instans SourceCharacterCodePoint di susunan CharacterReplacements ke titik kode. Kemudian tentukan titik kode pengganti untuk semua karakter target setara dengan menetapkan instans yang sesuai dengan susunan TargetCharacterCodePoint ini. Untuk menghapus karakter target alih-alih menggantikannya, atur instans TargetCharacterCodePoint yang sesuai ke nol (0). Anda dapat mengganti atau menghapus banyak nilai yang berbeda dari karakter target yang Anda inginkan dengan menentukan pasangan pengaturan SourceCharacterCodePoint dan TargetCharacterCodePoint tambahan di susunan CharacterReplacements. Jika Anda menentukan nilai yang sama untuk beberapa instans SourceCharacterCodePoint, nilai dari pengaturan yang sesuai terakhir dari TargetCharacterCodePoint berlaku pada target.

    Misalnya, anggaplah Anda menentukan nilai-nilai berikut untuk CharacterReplacements.

    "CharacterSetSettings": { "CharacterReplacements": [ { "SourceCharacterCodePoint": 62, "TargetCharacterCodePoint": 61 }, { "SourceCharacterCodePoint": 42, "TargetCharacterCodePoint": 41 } ] }

    Dalam contoh ini, AWS DMS ganti semua karakter dengan nilai hex titik kode sumber 62 pada target dengan karakter dengan nilai titik kode 61. Juga, AWS DMS mengganti semua karakter dengan kode sumber titik 42 pada target dengan karakter dengan nilai titik kode 41. Dengan kata lain, AWS DMS menggantikan semua instans huruf 'b' pada target dengan huruf 'a'. Demikian pula, AWS DMS menggantikan semua contoh surat 'B' pada target dengan surat itu. 'A'

  2. Validasi dan penggantian set karakter - Setelah penggantian karakter individu selesai, AWS DMS dapat memastikan bahwa semua karakter target memiliki poin kode Unicode yang valid dalam set karakter tunggal yang Anda tentukan. Anda menggunakan CharacterSetSupport di CharacterSetSettings untuk mengonfigurasi verifikasi dan modifikasi karakter target ini. Untuk menentukan set karakter verifikasi, atur CharacterSet di CharacterSetSupport dengan nilai string set karakter ini. Kemungkinan nilai untuk CharacterSet adalah sebagai berikut: Anda dapat AWS DMS memodifikasi karakter target yang tidak valid dengan salah satu cara berikut:

    • Tentukan pengganti tunggal Unicode kode titik untuk semua karakter target tidak valid, terlepas dari titik kode mereka saat ini. Untuk mengonfigurasi titik kode pengganti ini, atur ReplaceWithCharacterCodePoint di CharacterSetSupport ke nilai yang ditentukan.

    • Konfigurasikan penghapusan semua karakter target yang tidak valid dengan mengatur ReplaceWithCharacterCodePoint ke nol (0).

    Misalnya, anggaplah Anda menentukan nilai-nilai berikut untuk CharacterSetSupport.

    "CharacterSetSettings": { "CharacterSetSupport": { "CharacterSet": "UTF16_PlatformEndian", "ReplaceWithCharacterCodePoint": 0 } }

    Dalam contoh ini, AWS DMS menghapus karakter apa pun yang ditemukan pada target yang tidak valid di set karakter. "UTF16_PlatformEndian" Jadi, setiap karakter yang ditentukan dengan nilai hex 2FB6 dihapus. Nilai ini tidak valid karena ini adalah titik kode Unicode 4-byte dan set UTF16 karakter hanya menerima karakter dengan poin kode 2-byte.

catatan

Tugas replikasi melengkapi semua substitusi karakter tertentu sebelum memulai transformasi global atau tabel-tingkat yang Anda tentukan melalui pemetaan tabel. Untuk informasi lebih lanjut tentang pemetaan tabel, lihat Menggunakan pemetaan tabel untuk menentukan pengaturan tugas.

Substitusi karakter tidak mendukung tipe LOB data. Ini termasuk tipe data apa pun yang DMS dianggap sebagai tipe data. LOB Misalnya, Extended tipe data di Oracle dianggap sebagai. LOB Untuk informasi selengkapnya tentang tipe data sumber, lihat berikut. Jenis data sumber untuk Oracle

Nilai-nilai yang AWS DMS mendukung untuk CharacterSet muncul dalam tabel berikut.

UTF-8 ibm-860_P100-1995 ibm-280_P100-1995
UTF-16 ibm-861_P100-1995 ibm-284_P100-1995
UTF-16BE ibm-862_P100-1995 ibm-285_P100-1995
UTF-16LE ibm-863_P100-1995 ibm-290_P100-1995
UTF-32 ibm-864_X110-1999 ibm-297_P100-1995
UTF-32BE ibm-865_P100-1995 ibm-420_X120-1999
UTF-32LE ibm-866_P100-1995 ibm-424_P100-1995
UTF16_PlatformEndian ibm-867_P100-1998 ibm-500_P100-1995
UTF16_OppositeEndian ibm-868_P100-1995 ibm-803_P100-1999
UTF32_PlatformEndian ibm-869_P100-1995 ibm-838_P100-1995
UTF32_OppositeEndian ibm-878_P100-1996 ibm-870_P100-1995
UTF-16BE,version=1 ibm-901_P100-1999 ibm-871_P100-1995
UTF-16LE,version=1 ibm-902_P100-1999 ibm-875_P100-1995
UTF-16,version=1 ibm-922_P100-1999 ibm-918_P100-1995
UTF-16,version=2 ibm-1168_P100-2002 ibm-930_P120-1999
UTF-7 ibm-4909_P100-1999 ibm-933_P110-1995
IMAP-mailbox-name ibm-5346_P100-1998 ibm-935_P110-1999
SCSU ibm-5347_P100-1998 ibm-937_P110-1999
BOCU-1 ibm-5348_P100-1997 ibm-939_P120-1999
CESU-8 ibm-5349_P100-1998 ibm-1025_P100-1995
ISO-8859-1 ibm-5350_P100-1998 ibm-1026_P100-1995
US-ASCII ibm-9447_P100-2002 ibm-1047_P100-1995
gb18030 ibm-9448_X100-2005 ibm-1097_P100-1995
ibm-912_P100-1995 ibm-9449_P100-2002 ibm-1112_P100-1995
ibm-913_P100-2000 ibm-5354_P100-1998 ibm-1122_P100-1999
ibm-914_P100-1995 ibm-1250_P100-1995 ibm-1123_P100-1995
ibm-915_P100-1995 ibm-1251_P100-1995 ibm-1130_P100-1997
ibm-1089_P100-1995 ibm-1252_P100-2000 ibm-1132_P100-1998
ibm-9005_X110-2007 ibm-1253_P100-1995 ibm-1137_P100-1999
ibm-813_P100-1995 ibm-1254_P100-1995 ibm-4517_P100-2005
ibm-5012_P100-1999 ibm-1255_P100-1995 ibm-1140_P100-1997
ibm-916_P100-1995 ibm-5351_P100-1998 ibm-1141_P100-1997
ibm-920_P100-1995 ibm-1256_P110-1997 ibm-1142_P100-1997
iso-8859_10-1998 ibm-5352_P100-1998 ibm-1143_P100-1997
iso-8859_11-2001 ibm-1257_P100-1995 ibm-1144_P100-1997
ibm-921_P100-1995 ibm-5353_P100-1998 ibm-1145_P100-1997
iso-8859_14-1998 ibm-1258_P100-1997 ibm-1146_P100-1997
ibm-923_P100-1998 macos-0_2-10.2 ibm-1147_P100-1997
ibm-942_P12A-1999 macos-6_2-10.4 ibm-1148_P100-1997
ibm-943_P15A-2003 macos-7_3-10.2 ibm-1149_P100-1997
ibm-943_P130-1999 macos-29-10.2 ibm-1153_P100-1999
ibm-33722_P12A_P12A-2009_U2 macos-35-10.2 ibm-1154_P100-1999
ibm-33722_P120-1999 ibm-1051_P100-1995 ibm-1155_P100-1999
ibm-954_P101-2007 ibm-1276_P100-1995 ibm-1156_P100-1999
euc-jp-2007 ibm-1006_P100-1995 ibm-1157_P100-1999
ibm-1373_P100-2002 ibm-1098_P100-1995 ibm-1158_P100-1999
windows-950-2000 ibm-1124_P100-1996 ibm-1160_P100-1999
ibm-950_P110-1999 ibm-1125_P100-1997 ibm-1164_P100-1999
ibm-1375_P100-2008 ibm-1129_P100-1997 ibm-1364_P110-2007
ibm-5471_P100-2006 ibm-1131_P100-1997 ibm-1371_P100-1999
ibm-1386_P100-2001 ibm-1133_P100-1997 ibm-1388_P103-2001
windows-936-2000 ISO_2022,locale=ja,version=0 ibm-1390_P110-2003
ibm-1383_P110-1999 ISO_2022,locale=ja,version=1 ibm-1399_P110-2003
ibm-5478_P100-1995 ISO_2022,locale=ja,version=2 ibm-5123_P100-1999
euc-tw-2014 ISO_2022,locale=ja,version=3 ibm-8482_P100-1999
ibm-964_P110-1999 ISO_2022,locale=ja,version=4 ibm-16684_P110-2003
ibm-949_P110-1999 ISO_2022,locale=ko,version=0 ibm-4899_P100-1998
ibm-949_P11A-1999 ISO_2022,locale=ko,version=1 ibm-4971_P100-1999
ibm-970_P110_P110-2006_U2 ISO_2022,locale=zh,version=0 ibm-9067_X100-2005
ibm-971_P100-1995 ISO_2022,locale=zh,version=1 ibm-12712_P100-1998
ibm-1363_P11B-1998 ISO_2022,locale=zh,version=2 ibm-16804_X110-1999
ibm-1363_P110-1997 HZ ibm-37_P100-1995,swaplfnl
windows-949-2000 x11-compound-text ibm-1047_P100-1995,swaplfnl
windows-874-2000 ISCII,version=0 ibm-1140_P100-1997,swaplfnl
ibm-874_P100-1995 ISCII,version=1 ibm-1141_P100-1997,swaplfnl
ibm-1162_P100-1999 ISCII,version=2 ibm-1142_P100-1997,swaplfnl
ibm-437_P100-1995 ISCII,version=3 ibm-1143_P100-1997,swaplfnl
ibm-720_P100-1997 ISCII,version=4 ibm-1144_P100-1997,swaplfnl
ibm-737_P100-1997 ISCII,version=5 ibm-1145_P100-1997,swaplfnl
ibm-775_P100-1996 ISCII,version=6 ibm-1146_P100-1997,swaplfnl
ibm-850_P100-1995 ISCII,version=7 ibm-1147_P100-1997,swaplfnl
ibm-851_P100-1995 ISCII,version=8 ibm-1148_P100-1997,swaplfnl
ibm-852_P100-1995 LMBCS-1 ibm-1149_P100-1997,swaplfnl
ibm-855_P100-1995 ibm-37_P100-1995 ibm-1153_P100-1999,swaplfnl
ibm-856_P100-1995 ibm-273_P100-1995 ibm-12712_P100-1998,swaplfnl
ibm-857_P100-1995 ibm-277_P100-1995 ibm-16804_X110-1999,swaplfnl
ibm-858_P100-1997 ibm-278_P100-1995 ebcdic-xml-us