RDS-für-PostgreSQL-Kollatierungen für EBCDIC- und andere Mainframe-Migrationen

RDS-für-PostgreSQL-Versionen 10 und höher enthalten die ICU-Version 60.2, die auf Unicode 10.0 basiert und Kollationen aus dem Unicode Common Locale Data Repository, CLDR 32, enthält. Diese Software-Internationalisierungsbibliotheken stellen sicher, dass Zeichenkodierungen unabhängig vom Betriebssystem oder der Plattform einheitlich dargestellt werden. Weitere Informationen zu Unicode CLDR-32 finden Sie in den CLDR 32-Versionshinweisen auf der Unicode CLDR-Website. Weitere Informationen zu den Internationalisierungskomponenten für Unicode (ICU) finden Sie auf der Website des ICU Technical Committee (). ICU-TC Weitere Informationen dazu finden Sie unter Laden Sie ICU-60 ICU 60 herunter.

Ab Version 14.3 enthält RDS for PostgreSQL auch Kollationen, die bei der Datenintegration und -konvertierung aus Systemen helfen. EBCDIC-based Der erweiterte binär codierte Dezimalaustauschcode oderEBCDICEncoding wird häufig von Mainframe-Betriebssystemen verwendet. Diese RDS-provided Amazon-Kollationen sind eng definiert, um nur die Unicode-Zeichen zu sortieren, die direkt EBCDIC-Codepages zugeordnet sind. Die Zeichen werden in EBCDIC-Codepunktreihenfolge sortiert, um eine Datenvalidierung nach der Konvertierung zu ermöglichen. Diese Sortierungen enthalten weder denormalisierte Formen noch Unicode-Zeichen, die nicht direkt einem Zeichen auf der EBCDIC-Quellcodepage zugeordnet sind.

Die Zeichenzuordnungen zwischen EBCDIC-Codepages und Unicode-Codepunkten basieren auf von IBM veröffentlichten Tabellen. Das komplette Set ist bei IBM erhältlich alskomprimierte Dateizum Herunterladen. RDS für PostgreSQL verwendete diese Zuordnungen mit Tools, die von der ICU bereitgestellt wurden, um die in den Tabellen in diesem Abschnitt aufgeführten Kollatierungen zu erstellen. Die Kollationsnamen enthalten eine Sprache und ein Land, wie von der Intensivstation gefordert. EBCDIC-Codepages spezifizieren jedoch keine Sprachen, und einige EBCDIC-Codepages decken mehrere Länder ab. Das bedeutet, dass der Sprach- und Länderteil der Sortierungsnamen in der Tabelle willkürlich sind und nicht mit dem aktuellen Gebietsschema übereinstimmen müssen. Mit anderen Worten, die Codepage-Nummer ist der wichtigste Teil des Sortierungsnamens in dieser Tabelle. Sie können jede der in den folgenden Tabellen aufgeführten Kollatierungen in jeder RDS für PostgreSQL-Datenbank verwenden.

Unicode to EBCDIC collations table – Einige Mainframe-Datenmigrationstools verwenden intern LATIN1 oder LATIN9, um Daten zu codieren und zu verarbeiten. Solche Tools verwenden Roundtrip-Schemata, um die Datenintegrität zu wahren und die umgekehrte Konvertierung zu unterstützen. Die Sortierungen in dieser Tabelle können von Tools verwendet werden, die Daten mithilfe der LATIN1-Codierung verarbeiten, was keine besondere Behandlung erfordert.
Unicode to LATIN9 collations table – Sie können diese Kollatierungen in jeder RDS für PostgreSQL-Datenbank verwenden.

In der folgenden Tabelle finden Sie in RDS für PostgreSQL verfügbare Kollatierungen, die EBCDIC-Codepages Unicode-Codepunkten zuordnen. Es wird empfohlen, die Sortierungen in dieser Tabelle für die Anwendungsentwicklung zu verwenden, die eine Sortierung basierend auf der Reihenfolge der IBM Codepages erfordert.

Name der PostgreSQL-Sortierung	Beschreibung der Code-Page-Zuordnung und Sortierreihenfolge
da- DK-cp277-x-icu	Unicode-Zeichen, die direkt IBM EBCDIC Code Page 277 zugeordnet sind (pro Konvertierungstabellen), werden in IBM CP 277-Codepunkt-Reihenfolge sortiert
de- DE-cp273-x-icu	Unicode-Zeichen, die direkt IBM EBCDIC Code Page 273 zugeordnet sind (pro Konvertierungstabellen), werden in IBM CP 273-Codepunkt-Reihenfolge sortiert
de- GB-cp285-x-icu	Unicode-Zeichen, die direkt IBM EBCDIC Code Page 285 zugeordnet sind (pro Konvertierungstabellen), werden in IBM CP 285-Codepunkt-Reihenfolge sortiert
de- US-cp037-x-icu	Unicode-Zeichen, die direkt IBM EBCDIC Code Page 037 zugeordnet sind (pro Konvertierungstabellen), werden in IBM CP 37-Codepunktreihenfolge sortiert
ja- ES-cp284-x-icu	Unicode-Zeichen, die direkt IBM EBCDIC Code Page 284 zugeordnet sind (pro Konvertierungstabellen), werden in IBM CP 284-Codepunkt-Reihenfolge sortiert
fi- FI-cp278-x-icu	Unicode-Zeichen, die direkt IBM EBCDIC Code Page 278 zugeordnet sind (pro Konvertierungstabellen), werden in IBM CP 278-Codepunkt-Reihenfolge sortiert
fr- FR-cp297-x-icu	Unicode-Zeichen, die direkt IBM EBCDIC Code Page 297 zugeordnet sind (pro Konvertierungstabellen), werden in IBM CP 297-Codepunkt-Reihenfolge sortiert
es- IT-cp280-x-icu	Unicode-Zeichen, die direkt IBM EBCDIC Code Page 280 zugeordnet sind (pro Konvertierungstabellen), werden in IBM CP 280 Codepunkt-Reihenfolge sortiert.
nl- BE-cp500-x-icu	Unicode-Zeichen, die direkt IBM EBCDIC Code Page 500 zugeordnet sind (pro Konvertierungstabellen), werden in IBM CP 500-Codepunktreihenfolge sortiert

Amazon RDS bietet eine Reihe zusätzlicher Sortierungen, mit denen Unicode-Codepunkte, die LATIN9-Zeichen zugeordnet sind, anhand der von IBM veröffentlichten Tabellen in der Reihenfolge der ursprünglichen Codepunkte gemäß der EBCDIC-Codepage der Quelldaten sortiert werden.

Name der PostgreSQL-Sortierung	Beschreibung der Code-Page-Zuordnung und Sortierreihenfolge
da- DK-cp1142m-x-icu	Unicode-Zeichen, die LATIN9-Zeichen zugeordnet sind, die ursprünglich aus IBM EBCDIC Code Page 1142 konvertiert wurden (pro Konvertierungstabellen), werden in IBM CP 1142-Codepunktreih
de- DE-cp1141m-x-icu	Unicode-Zeichen, die LATIN9-Zeichen zugeordnet sind, die ursprünglich aus IBM EBCDIC Code Page 1141 konvertiert wurden (pro Konvertierungstabellen), werden in IBM CP 1141-Codepunktreih
de- GB-cp1146m-x-icu	Unicode-Zeichen, die LATIN9-Zeichen zugeordnet sind, die ursprünglich aus IBM EBCDIC Code Page 1146 konvertiert wurden (pro Konvertierungstabellen), werden in IBM CP 1146-Codepunktreih
de- US-cp1140m-x-icu	Unicode-Zeichen, die LATIN9-Zeichen zugeordnet sind, die ursprünglich aus IBM EBCDIC Code Page 1140 konvertiert wurden (pro Konvertierungstabellen), werden in IBM CP 1140 Codepunktreih
ja- ES-cp1145m-x-icu	Unicode-Zeichen, die LATIN9-Zeichen zugeordnet sind, die ursprünglich aus IBM EBCDIC Code Page 1145 konvertiert wurden (pro Konvertierungstabellen), werden in IBM CP 1145-Codepunktreih
fi- FI-cp1143m-x-icu	Unicode-Zeichen, die LATIN9-Zeichen zugeordnet sind, die ursprünglich aus IBM EBCDIC Code Page 1143 konvertiert wurden (pro Konvertierungstabellen), werden in IBM CP 1143 Codepunktreih
fr- FR-cp1147m-x-icu	Unicode-Zeichen, die LATIN9-Zeichen zugeordnet sind, die ursprünglich aus IBM EBCDIC Code Page 1147 konvertiert wurden (pro Konvertierungstabellen), werden in IBM CP 1147 Codepunktreih
es- IT-cp1144m-x-icu	Unicode-Zeichen, die LATIN9-Zeichen zugeordnet sind, die ursprünglich aus IBM EBCDIC-Codepage 1144 konvertiert wurden (pro Konvertierungstabellen), werden in IBM CP 1144-Codepunktreih
nl- BE-cp1148m-x-icu	Unicode-Zeichen, die LATIN9-Zeichen zugeordnet sind, die ursprünglich aus IBM EBCDIC Code Page 1148 konvertiert wurden (pro Konvertierungstabellen), werden in IBM CP 1148 Codepunktreih

Im Folgenden finden Sie ein Beispiel für die Verwendung eines RDS-Werts für PostgreSQL-Sortierungen.


db1=> SELECT pg_import_system_collations('pg_catalog');
 pg_import_system_collations
-----------------------------
                          36
db1=> SELECT '¤' < 'a' col1;
 col1
------
 t  
db1=> SELECT '¤' < 'a' COLLATE "da-DK-cp277-x-icu" col1;
 col1
------
 f

Wir empfehlen Ihnen, die Sortierungen in derUnicode to EBCDIC collations tableund in derUnicode to LATIN9 collations tablefür die Anwendungsentwicklung, die eine Sortierung basierend auf der Reihenfolge der IBM Codepages erfordert. Die folgenden Sortierungen (mit dem Suffix „b“) sind auch in sichtbarpg_collation, sind aber für die Verwendung durch Mainframe-Datenintegrations- und Migrationstools vorgesehen, da sie Codepages mit bestimmten Codepunktverschiebungen zuordnen und erfordern eine besondere Behandlung bei AWS der Sortierung. Mit anderen Worten: Die folgenden Sortierungen werden nicht empfohlen.

da- DK-277b-x-icu
da- DK-1142b-x-icu
de- DE-cp273b-x-icu
de- DE-cp1141b-x-icu
de- GB-cp1146b-x-icu
de- GB-cp285b-x-icu
de- US-cp037b-x-icu
de- US-cp1140b-x-icu
ja- ES-cp1145b-x-icu
ja- ES-cp284b-x-icu
fi- FI-cp1143b-x-icu
fr- FR-cp1147b-x-icu
fr- FR-cp297b-x-icu
es- IT-cp1144b-x-icu
es- IT-cp280b-x-icu
nl- BE-cp1148b-x-icu
nl- BE-cp500b-x-icu

Weitere Informationen zur Migration von Anwendungen aus Mainframe-Umgebungen zu AWS finden Sie unter Was ist AWS Mainframe-Modernisierung? .

Weitere Informationen zu PostgreSQL und Kollationen finden Sie unter Support für Kollationen in der PostgreSQL-Dokumentation.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Tablespaces

Verwalten der logischen Slot-Synchronisation