기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
문자 대체 작업 설정
복제 작업이 AWS DMS
STRING
또는 WSTRING
데이터 유형의 모든 원본 데이터베이스 열에 대해 대상 데이터베이스에서 문자 대체를 수행하도록 지정할 수 있습니다. 작업 구성 파일을 사용하여 작업 설정을 지정하는 방법에 관한 자세한 내용은 작업 설정 예제을 참조하십시오.
다음 원본 및 대상 데이터베이스에서 엔드포인트가 있는 모든 작업에 대한 문자 대체를 구성할 수 있습니다.
-
소스 데이터베이스:
-
Oracle
-
마이크로소프트 SQL 서버
-
마이 SQL
-
포스트그레 SQL
-
SAP어댑티브 서버 엔터프라이즈 () ASE
-
IBMDb2 LUW
-
-
대상 데이터베이스:
-
Oracle
-
마이크로소프트 SQL 서버
-
마이 SQL
-
포스트그레 SQL
-
SAP어댑티브 서버 엔터프라이즈 () ASE
-
Amazon Redshift
-
작업 설정에서 CharacterSetSettings
파라미터를 사용하여 문자 대체를 지정할 수 있습니다. 이 문자 대체는 16진수 표기법으로 유니코드 코드 포인트 값을 사용하여 지정된 문자에 대해 발생합니다. 두 단계 모두 지정된 경우 두 단계를 다음 순서로 사용하여 문자 대체를 구현할 수 있습니다.
-
개별 문자 교체 — 소스에서 선택한 문자 값을 대상에 있는 해당 문자의 지정된 대체 값으로 바꿀 AWS DMS 수 있습니다.
CharacterSetSettings
에서CharacterReplacements
배열을 사용하여 지정한 유니코드 코드 포인트가 있는 모든 소스 문자를 선택합니다. 또한 이 배열을 사용하여 대상의 해당 문자에 대한 대체 코드 포인트를 지정합니다.지정된 코드 포인트가 있는 소스의 모든 문자를 선택하려면
CharacterReplacements
배열에서SourceCharacterCodePoint
의 인스턴스를 해당 코드 포인트로 설정합니다. 그런 다음 이 배열에서TargetCharacterCodePoint
의 해당 인스턴스를 설정하여 동등한 모든 대상 문자에 대한 대체 코드 포인트를 지정합니다. 대상 문자를 바꾸지 않고 삭제하려면TargetCharacterCodePoint
의 해당 인스턴스를 0으로 설정합니다.CharacterReplacements
배열에서SourceCharacterCodePoint
및TargetCharacterCodePoint
설정의 추가 쌍을 지정하여 원하는 만큼 서로 다른 값의 대상 문자를 바꾸거나 삭제할 수 있습니다.SourceCharacterCodePoint
의 여러 인스턴스에 동일한 값을 지정하는 경우,TargetCharacterCodePoint
의 마지막 해당 설정 값이 대상에 적용됩니다.예를 들어
CharacterReplacements
에 다음과 같은 값을 지정한다고 가정하겠습니다."CharacterSetSettings": { "CharacterReplacements": [ { "SourceCharacterCodePoint": 62, "TargetCharacterCodePoint": 61 }, { "SourceCharacterCodePoint": 42, "TargetCharacterCodePoint": 41 } ] }
이 예제에서는 대상의 소스 코드 포인트 16진수 값 62인 모든 문자를 코드 포인트 값 61의 문자로 AWS DMS 바꿉니다. 또한 대상의 소스 코드 포인트 42인 모든 문자를 코드 포인트 값이 41인 문자로 AWS DMS 바꿉니다. 다시 말해, AWS DMS 는 대상에 있는 문자
'b'
의 모든 인스턴스를 문자'a'
로 바꿉니다. 마찬가지로 대상에 있는 문자의 모든 인스턴스를 문자로 AWS DMS'B'
바꿉니다.'A'
-
문자 집합 유효성 검사 및 교체 — 개별 문자 교체가 완료된 후 지정한 단일 문자 집합에서 모든 대상 문자에 유효한 유니코드 코드 포인트가 있는지 확인할 AWS DMS 수 있습니다.
CharacterSetSettings
에서CharacterSetSupport
를 사용하여 이 대상 문자 검증 및 수정을 구성할 수 있습니다. 검증 문자 집합을 지정하려면CharacterSetSupport
의CharacterSet
를 문자 집합의 문자열 값으로 설정합니다. (CharacterSet
에 대해 가능한 값은 다음과 같습니다.) 다음 방법 중 하나로 잘못된 대상 문자를 AWS DMS 수정할 수 있습니다.-
현재 코드 포인트에 관계없이 유효하지 않은 모든 대상 문자에 대해 단일 대체 유니코드 코드 포인트를 지정합니다. 이 대체 코드 포인트를 구성하려면
CharacterSetSupport
의ReplaceWithCharacterCodePoint
를 지정된 값으로 설정합니다. -
ReplaceWithCharacterCodePoint
를 0으로 설정하여 유효하지 않은 모든 대상 문자의 삭제를 구성합니다.
예를 들어
CharacterSetSupport
에 다음과 같은 값을 지정한다고 가정하겠습니다."CharacterSetSettings": { "CharacterSetSupport": { "CharacterSet": "UTF16_PlatformEndian", "ReplaceWithCharacterCodePoint": 0 } }
이 예제에서는 대상에서 발견된 문자 중
"UTF16_PlatformEndian"
문자 집합에서 유효하지 않은 문자를 모두 AWS DMS 삭제합니다. 따라서 16진수 값2FB6
으로 지정된 모든 문자가 삭제됩니다. 이 값은 4바이트 유니코드 코드 포인트이고 UTF16 문자 집합은 2바이트 코드 포인트가 있는 문자만 허용하므로 유효하지 않습니다. -
참고
복제 작업은 테이블 매핑을 통해 지정한 전역 또는 테이블 수준 변환을 시작하기 전에 지정된 문자 대체를 모두 완료합니다. 테이블 매핑에 관한 자세한 내용은 작업 설정을 지정하기 위한 테이블 매핑 사용 섹션을 참조하십시오.
문자 대체는 데이터 유형을 지원하지 않습니다. LOB 여기에는 데이터 유형으로 DMS 간주되는 모든 데이터 유형이 포함됩니다. LOB 예를 들어, Oracle의 Extended
데이터 유형은 a로 간주됩니다. LOB 소스 데이터 유형에 대한 자세한 내용은 Oracle용 소스 데이터 형식 섹션을 참조하세요.
를 AWS DMS 지원하는 값은 다음 표에 CharacterSet
나와 있습니다.
UTF-8 |
ibm-860_P100-1995 |
ibm-280_P100-1995 |
UTF-16 |
ibm-861_P100-1995 |
ibm-284_P100-1995 |
UTF-16BE |
ibm-862_P100-1995 |
ibm-285_P100-1995 |
UTF-16LE |
ibm-863_P100-1995 |
ibm-290_P100-1995 |
UTF-32 |
ibm-864_X110-1999 |
ibm-297_P100-1995 |
UTF-32BE |
ibm-865_P100-1995 |
ibm-420_X120-1999 |
UTF-32LE |
ibm-866_P100-1995 |
ibm-424_P100-1995 |
UTF16_PlatformEndian |
ibm-867_P100-1998 |
ibm-500_P100-1995 |
UTF16_OppositeEndian |
ibm-868_P100-1995 |
ibm-803_P100-1999 |
UTF32_PlatformEndian |
ibm-869_P100-1995 |
ibm-838_P100-1995 |
UTF32_OppositeEndian |
ibm-878_P100-1996 |
ibm-870_P100-1995 |
UTF-16BE,version=1 |
ibm-901_P100-1999 |
ibm-871_P100-1995 |
UTF-16LE,version=1 |
ibm-902_P100-1999 |
ibm-875_P100-1995 |
UTF-16,version=1 |
ibm-922_P100-1999 |
ibm-918_P100-1995 |
UTF-16,version=2 |
ibm-1168_P100-2002 |
ibm-930_P120-1999 |
UTF-7 |
ibm-4909_P100-1999 |
ibm-933_P110-1995 |
IMAP-mailbox-name |
ibm-5346_P100-1998 |
ibm-935_P110-1999 |
SCSU |
ibm-5347_P100-1998 |
ibm-937_P110-1999 |
BOCU-1 |
ibm-5348_P100-1997 |
ibm-939_P120-1999 |
CESU-8 |
ibm-5349_P100-1998 |
ibm-1025_P100-1995 |
ISO-8859-1 |
ibm-5350_P100-1998 |
ibm-1026_P100-1995 |
US-ASCII |
ibm-9447_P100-2002 |
ibm-1047_P100-1995 |
gb18030 |
ibm-9448_X100-2005 |
ibm-1097_P100-1995 |
ibm-912_P100-1995 |
ibm-9449_P100-2002 |
ibm-1112_P100-1995 |
ibm-913_P100-2000 |
ibm-5354_P100-1998 |
ibm-1122_P100-1999 |
ibm-914_P100-1995 |
ibm-1250_P100-1995 |
ibm-1123_P100-1995 |
ibm-915_P100-1995 |
ibm-1251_P100-1995 |
ibm-1130_P100-1997 |
ibm-1089_P100-1995 |
ibm-1252_P100-2000 |
ibm-1132_P100-1998 |
ibm-9005_X110-2007 |
ibm-1253_P100-1995 |
ibm-1137_P100-1999 |
ibm-813_P100-1995 |
ibm-1254_P100-1995 |
ibm-4517_P100-2005 |
ibm-5012_P100-1999 |
ibm-1255_P100-1995 |
ibm-1140_P100-1997 |
ibm-916_P100-1995 |
ibm-5351_P100-1998 |
ibm-1141_P100-1997 |
ibm-920_P100-1995 |
ibm-1256_P110-1997 |
ibm-1142_P100-1997 |
iso-8859_10-1998 |
ibm-5352_P100-1998 |
ibm-1143_P100-1997 |
iso-8859_11-2001 |
ibm-1257_P100-1995 |
ibm-1144_P100-1997 |
ibm-921_P100-1995 |
ibm-5353_P100-1998 |
ibm-1145_P100-1997 |
iso-8859_14-1998 |
ibm-1258_P100-1997 |
ibm-1146_P100-1997 |
ibm-923_P100-1998 |
macos-0_2-10.2 |
ibm-1147_P100-1997 |
ibm-942_P12A-1999 |
macos-6_2-10.4 |
ibm-1148_P100-1997 |
ibm-943_P15A-2003 |
macos-7_3-10.2 |
ibm-1149_P100-1997 |
ibm-943_P130-1999 |
macos-29-10.2 |
ibm-1153_P100-1999 |
ibm-33722_P12A_P12A-2009_U2 |
macos-35-10.2 |
ibm-1154_P100-1999 |
ibm-33722_P120-1999 |
ibm-1051_P100-1995 |
ibm-1155_P100-1999 |
ibm-954_P101-2007 |
ibm-1276_P100-1995 |
ibm-1156_P100-1999 |
euc-jp-2007 |
ibm-1006_P100-1995 |
ibm-1157_P100-1999 |
ibm-1373_P100-2002 |
ibm-1098_P100-1995 |
ibm-1158_P100-1999 |
windows-950-2000 |
ibm-1124_P100-1996 |
ibm-1160_P100-1999 |
ibm-950_P110-1999 |
ibm-1125_P100-1997 |
ibm-1164_P100-1999 |
ibm-1375_P100-2008 |
ibm-1129_P100-1997 |
ibm-1364_P110-2007 |
ibm-5471_P100-2006 |
ibm-1131_P100-1997 |
ibm-1371_P100-1999 |
ibm-1386_P100-2001 |
ibm-1133_P100-1997 |
ibm-1388_P103-2001 |
windows-936-2000 |
ISO_2022,locale=ja,version=0 |
ibm-1390_P110-2003 |
ibm-1383_P110-1999 |
ISO_2022,locale=ja,version=1 |
ibm-1399_P110-2003 |
ibm-5478_P100-1995 |
ISO_2022,locale=ja,version=2 |
ibm-5123_P100-1999 |
euc-tw-2014 |
ISO_2022,locale=ja,version=3 |
ibm-8482_P100-1999 |
ibm-964_P110-1999 |
ISO_2022,locale=ja,version=4 |
ibm-16684_P110-2003 |
ibm-949_P110-1999 |
ISO_2022,locale=ko,version=0 |
ibm-4899_P100-1998 |
ibm-949_P11A-1999 |
ISO_2022,locale=ko,version=1 |
ibm-4971_P100-1999 |
ibm-970_P110_P110-2006_U2 |
ISO_2022,locale=zh,version=0 |
ibm-9067_X100-2005 |
ibm-971_P100-1995 |
ISO_2022,locale=zh,version=1 |
ibm-12712_P100-1998 |
ibm-1363_P11B-1998 |
ISO_2022,locale=zh,version=2 |
ibm-16804_X110-1999 |
ibm-1363_P110-1997 |
HZ |
ibm-37_P100-1995,swaplfnl |
windows-949-2000 |
x11-compound-text |
ibm-1047_P100-1995,swaplfnl |
windows-874-2000 |
ISCII,version=0 |
ibm-1140_P100-1997,swaplfnl |
ibm-874_P100-1995 |
ISCII,version=1 |
ibm-1141_P100-1997,swaplfnl |
ibm-1162_P100-1999 |
ISCII,version=2 |
ibm-1142_P100-1997,swaplfnl |
ibm-437_P100-1995 |
ISCII,version=3 |
ibm-1143_P100-1997,swaplfnl |
ibm-720_P100-1997 |
ISCII,version=4 |
ibm-1144_P100-1997,swaplfnl |
ibm-737_P100-1997 |
ISCII,version=5 |
ibm-1145_P100-1997,swaplfnl |
ibm-775_P100-1996 |
ISCII,version=6 |
ibm-1146_P100-1997,swaplfnl |
ibm-850_P100-1995 |
ISCII,version=7 |
ibm-1147_P100-1997,swaplfnl |
ibm-851_P100-1995 |
ISCII,version=8 |
ibm-1148_P100-1997,swaplfnl |
ibm-852_P100-1995 |
LMBCS-1 |
ibm-1149_P100-1997,swaplfnl |
ibm-855_P100-1995 |
ibm-37_P100-1995 |
ibm-1153_P100-1999,swaplfnl |
ibm-856_P100-1995 |
ibm-273_P100-1995 |
ibm-12712_P100-1998,swaplfnl |
ibm-857_P100-1995 |
ibm-277_P100-1995 |
ibm-16804_X110-1999,swaplfnl |
ibm-858_P100-1997 |
ibm-278_P100-1995 |
ebcdic-xml-us |