Configurações da tarefa de substituição de caracteres - AWS Database Migration Service

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Configurações da tarefa de substituição de caracteres

Você pode especificar que sua tarefa de replicação realize substituições de caracteres no banco de dados de destino para todas as colunas do banco de dados de origem com o tipo de WSTRING dados AWS DMS STRING ou. Para obter informações sobre como utilizar um arquivo de configuração de tarefas para definir as configurações de tarefas, consulte Exemplo de configurações de tarefas.

É possível configurar a substituição de caracteres para qualquer tarefa com endpoints dos seguintes bancos de dados de origem e de destino:

  • Bancos de dados de origem:

    • Oracle

    • SQLServidor Microsoft

    • Meu SQL

    • Postger SQL

    • SAPServidor corporativo adaptável () ASE

    • IBMDb2 LUW

  • Bancos de dados de destino:

    • Oracle

    • SQLServidor Microsoft

    • Meu SQL

    • Postger SQL

    • SAPServidor corporativo adaptável () ASE

    • Amazon Redshift

É possível especificar substituições de caracteres utilizando o parâmetro CharacterSetSettings nas configurações da tarefa. Essas substituições de caracteres ocorrem para caracteres especificados utilizando o valor de ponto de código Unicode em notação hexadecimal. É possível implementar as substituições em duas fases, na seguinte ordem, se ambas forem especificadas:

  1. Substituição individual de caracteres — AWS DMS pode substituir os valores dos caracteres selecionados na fonte por valores de substituição especificados dos caracteres correspondentes no destino. Utilize a matriz CharacterReplacements no CharacterSetSettings para selecionar todos os caracteres de origem com os pontos de código Unicode que você especificar. Utilize essa matriz também para especificar os pontos de código de substituição para os caracteres correspondentes no destino.

    Para selecionar todos os caracteres na origem que têm um determinado ponto de código, defina uma instância de SourceCharacterCodePoint na matriz CharacterReplacements para esse ponto de código. Depois, especifique o ponto de código de substituição para todos os caracteres de destino equivalentes definindo a instância correspondente de TargetCharacterCodePoint nessa matriz. Para excluir caracteres de destino em vez de substituí-los, defina as instâncias apropriadas de TargetCharacterCodePoint como zero (0). É possível substituir ou excluir quantos valores diferentes de caracteres de destino desejar especificando pares adicionais de configurações SourceCharacterCodePoint e TargetCharacterCodePoint na matriz CharacterReplacements. Se você especificar o mesmo valor para várias instâncias de SourceCharacterCodePoint, o valor da última configuração correspondente de TargetCharacterCodePoint se aplicará ao destino.

    Por exemplo, suponha que você especifique os seguintes valores para CharacterReplacements.

    "CharacterSetSettings": { "CharacterReplacements": [ { "SourceCharacterCodePoint": 62, "TargetCharacterCodePoint": 61 }, { "SourceCharacterCodePoint": 42, "TargetCharacterCodePoint": 41 } ] }

    Neste exemplo, AWS DMS substitui todos os caracteres com o valor hexadecimal 62 do ponto do código-fonte no destino por caracteres com o valor 61 do ponto de código. Além disso, AWS DMS substitui todos os caracteres com o ponto 42 do código-fonte no destino por caracteres com o valor 41 do ponto de código. Em outras palavras, o AWS DMS substitui todas as instâncias da letra 'b' no destino pela letra 'a'. Da mesma forma, AWS DMS substitui todas as instâncias da letra 'B' no alvo pela letra'A'.

  2. Validação e substituição do conjunto de caracteres — Após a conclusão de qualquer substituição individual de caracteres, AWS DMS pode garantir que todos os caracteres de destino tenham pontos de código Unicode válidos no único conjunto de caracteres especificado. Utilize o CharacterSetSupport em CharacterSetSettings para configurar essa verificação e modificação de caracteres de destino. Para especificar o conjunto de caracteres de verificação, defina CharacterSet em CharacterSetSupport como o valor de string do conjunto de caracteres. (Os valores possíveis de CharacterSet se seguem.) Você pode AWS DMS modificar os caracteres de destino inválidos de uma das seguintes formas:

    • Especifique um único ponto de código Unicode de substituição para todos os caracteres de destino inválidos, independentemente do ponto de código atual. Para configurar esse ponto de código de substituição, defina ReplaceWithCharacterCodePoint em CharacterSetSupport como o valor especificado.

    • Configure a exclusão de todos os caracteres de destino inválidos definindo ReplaceWithCharacterCodePoint como zero (0).

    Por exemplo, suponha que você especifique os seguintes valores para CharacterSetSupport.

    "CharacterSetSettings": { "CharacterSetSupport": { "CharacterSet": "UTF16_PlatformEndian", "ReplaceWithCharacterCodePoint": 0 } }

    Neste exemplo, AWS DMS exclui todos os caracteres encontrados no destino que são inválidos no conjunto de "UTF16_PlatformEndian" caracteres. Portanto, todos os caracteres especificados com o valor hexadecimal 2FB6 são excluídos. Esse valor é inválido porque é um ponto de código Unicode de 4 bytes e UTF16 os conjuntos de caracteres aceitam somente caracteres com pontos de código de 2 bytes.

nota

A tarefa de replicação conclui todas as substituições de caracteres especificadas antes de iniciar qualquer transformação global ou de tabela especificada por meio do mapeamento de tabela. Para obter mais informações sobre o mapeamento de tabela, consulte Utilizar o mapeamento de tabela para especificar as configurações da tarefa.

A substituição de caracteres não é compatível com tipos LOB de dados. Isso inclui qualquer tipo de dados DMS considerado um LOB tipo de dados. Por exemplo, o Extended tipo de dados no Oracle é considerado um. LOB Para obter mais informações sobre tags, consulte Tipos de dados de origem do Oracle:

Os valores que AWS DMS oferecem suporte para CharacterSet aparecem na tabela a seguir.

UTF-8 ibm-860_P100-1995 ibm-280_P100-1995
UTF-16 ibm-861_P100-1995 ibm-284_P100-1995
UTF-16BE ibm-862_P100-1995 ibm-285_P100-1995
UTF-16LE ibm-863_P100-1995 ibm-290_P100-1995
UTF-32 ibm-864_X110-1999 ibm-297_P100-1995
UTF-32BE ibm-865_P100-1995 ibm-420_X120-1999
UTF-32LE ibm-866_P100-1995 ibm-424_P100-1995
UTF16_PlatformEndian ibm-867_P100-1998 ibm-500_P100-1995
UTF16_OppositeEndian ibm-868_P100-1995 ibm-803_P100-1999
UTF32_PlatformEndian ibm-869_P100-1995 ibm-838_P100-1995
UTF32_OppositeEndian ibm-878_P100-1996 ibm-870_P100-1995
UTF-16BE,version=1 ibm-901_P100-1999 ibm-871_P100-1995
UTF-16LE,version=1 ibm-902_P100-1999 ibm-875_P100-1995
UTF-16,version=1 ibm-922_P100-1999 ibm-918_P100-1995
UTF-16,version=2 ibm-1168_P100-2002 ibm-930_P120-1999
UTF-7 ibm-4909_P100-1999 ibm-933_P110-1995
IMAP-mailbox-name ibm-5346_P100-1998 ibm-935_P110-1999
SCSU ibm-5347_P100-1998 ibm-937_P110-1999
BOCU-1 ibm-5348_P100-1997 ibm-939_P120-1999
CESU-8 ibm-5349_P100-1998 ibm-1025_P100-1995
ISO-8859-1 ibm-5350_P100-1998 ibm-1026_P100-1995
US-ASCII ibm-9447_P100-2002 ibm-1047_P100-1995
gb18030 ibm-9448_X100-2005 ibm-1097_P100-1995
ibm-912_P100-1995 ibm-9449_P100-2002 ibm-1112_P100-1995
ibm-913_P100-2000 ibm-5354_P100-1998 ibm-1122_P100-1999
ibm-914_P100-1995 ibm-1250_P100-1995 ibm-1123_P100-1995
ibm-915_P100-1995 ibm-1251_P100-1995 ibm-1130_P100-1997
ibm-1089_P100-1995 ibm-1252_P100-2000 ibm-1132_P100-1998
ibm-9005_X110-2007 ibm-1253_P100-1995 ibm-1137_P100-1999
ibm-813_P100-1995 ibm-1254_P100-1995 ibm-4517_P100-2005
ibm-5012_P100-1999 ibm-1255_P100-1995 ibm-1140_P100-1997
ibm-916_P100-1995 ibm-5351_P100-1998 ibm-1141_P100-1997
ibm-920_P100-1995 ibm-1256_P110-1997 ibm-1142_P100-1997
iso-8859_10-1998 ibm-5352_P100-1998 ibm-1143_P100-1997
iso-8859_11-2001 ibm-1257_P100-1995 ibm-1144_P100-1997
ibm-921_P100-1995 ibm-5353_P100-1998 ibm-1145_P100-1997
iso-8859_14-1998 ibm-1258_P100-1997 ibm-1146_P100-1997
ibm-923_P100-1998 macos-0_2-10.2 ibm-1147_P100-1997
ibm-942_P12A-1999 macos-6_2-10.4 ibm-1148_P100-1997
ibm-943_P15A-2003 macos-7_3-10.2 ibm-1149_P100-1997
ibm-943_P130-1999 macos-29-10.2 ibm-1153_P100-1999
ibm-33722_P12A_P12A-2009_U2 macos-35-10.2 ibm-1154_P100-1999
ibm-33722_P120-1999 ibm-1051_P100-1995 ibm-1155_P100-1999
ibm-954_P101-2007 ibm-1276_P100-1995 ibm-1156_P100-1999
euc-jp-2007 ibm-1006_P100-1995 ibm-1157_P100-1999
ibm-1373_P100-2002 ibm-1098_P100-1995 ibm-1158_P100-1999
windows-950-2000 ibm-1124_P100-1996 ibm-1160_P100-1999
ibm-950_P110-1999 ibm-1125_P100-1997 ibm-1164_P100-1999
ibm-1375_P100-2008 ibm-1129_P100-1997 ibm-1364_P110-2007
ibm-5471_P100-2006 ibm-1131_P100-1997 ibm-1371_P100-1999
ibm-1386_P100-2001 ibm-1133_P100-1997 ibm-1388_P103-2001
windows-936-2000 ISO_2022,locale=ja,version=0 ibm-1390_P110-2003
ibm-1383_P110-1999 ISO_2022,locale=ja,version=1 ibm-1399_P110-2003
ibm-5478_P100-1995 ISO_2022,locale=ja,version=2 ibm-5123_P100-1999
euc-tw-2014 ISO_2022,locale=ja,version=3 ibm-8482_P100-1999
ibm-964_P110-1999 ISO_2022,locale=ja,version=4 ibm-16684_P110-2003
ibm-949_P110-1999 ISO_2022,locale=ko,version=0 ibm-4899_P100-1998
ibm-949_P11A-1999 ISO_2022,locale=ko,version=1 ibm-4971_P100-1999
ibm-970_P110_P110-2006_U2 ISO_2022,locale=zh,version=0 ibm-9067_X100-2005
ibm-971_P100-1995 ISO_2022,locale=zh,version=1 ibm-12712_P100-1998
ibm-1363_P11B-1998 ISO_2022,locale=zh,version=2 ibm-16804_X110-1999
ibm-1363_P110-1997 HZ ibm-37_P100-1995,swaplfnl
windows-949-2000 x11-compound-text ibm-1047_P100-1995,swaplfnl
windows-874-2000 ISCII,version=0 ibm-1140_P100-1997,swaplfnl
ibm-874_P100-1995 ISCII,version=1 ibm-1141_P100-1997,swaplfnl
ibm-1162_P100-1999 ISCII,version=2 ibm-1142_P100-1997,swaplfnl
ibm-437_P100-1995 ISCII,version=3 ibm-1143_P100-1997,swaplfnl
ibm-720_P100-1997 ISCII,version=4 ibm-1144_P100-1997,swaplfnl
ibm-737_P100-1997 ISCII,version=5 ibm-1145_P100-1997,swaplfnl
ibm-775_P100-1996 ISCII,version=6 ibm-1146_P100-1997,swaplfnl
ibm-850_P100-1995 ISCII,version=7 ibm-1147_P100-1997,swaplfnl
ibm-851_P100-1995 ISCII,version=8 ibm-1148_P100-1997,swaplfnl
ibm-852_P100-1995 LMBCS-1 ibm-1149_P100-1997,swaplfnl
ibm-855_P100-1995 ibm-37_P100-1995 ibm-1153_P100-1999,swaplfnl
ibm-856_P100-1995 ibm-273_P100-1995 ibm-12712_P100-1998,swaplfnl
ibm-857_P100-1995 ibm-277_P100-1995 ibm-16804_X110-1999,swaplfnl
ibm-858_P100-1997 ibm-278_P100-1995 ebcdic-xml-us