RDSfür SQL Postgre-Kollationen für EBCDIC und andere Mainframe-Migrationen - Amazon Relational Database Service

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

RDSfür SQL Postgre-Kollationen für EBCDIC und andere Mainframe-Migrationen

RDSZu SQL Postgre-Versionen 10 und höher gehört ICU Version 6.0.2, die auf Unicode 10.0 basiert und Kollationen aus dem Unicode Common Locale Data Repository 32 enthält. CLDR Diese Software-Internationalisierungsbibliotheken stellen sicher, dass Zeichenkodierungen unabhängig vom Betriebssystem oder der Plattform einheitlich dargestellt werden. Weitere Informationen zu Unicode CLDR -32 finden Sie in den Versionshinweisen zu Version CLDR 32 auf der Unicode-Website. CLDR Weitere Informationen zu den Internationalisierungskomponenten für Unicode (ICU) finden Sie auf der Website des ICUTechnical Committee (ICU-TC). Informationen zu ICU -60 finden Sie unter Download 60. ICU

Ab Version 14.3 enthält RDS für Postgre SQL auch Kollationen, die bei der Datenintegration und Konvertierung aus basierten Systemen helfen. EBCDIC Der erweiterte binärkodierte dezimale Austauschcode oder die EBCDICCodierung wird häufig von Mainframe-Betriebssystemen verwendet. Diese von Amazon RDS bereitgestellten Sortierungen sind eng definiert, sodass nur die Unicode-Zeichen sortiert werden, die direkt Codepages zugeordnet sind. EBCDIC Die Zeichen werden in der Reihenfolge der EBCDIC Codepunkte sortiert, um eine Datenvalidierung nach der Konvertierung zu ermöglichen. Diese Sortierungen enthalten weder denormalisierte Formen noch Unicode-Zeichen, die nicht direkt einem Zeichen auf der Quellcodepage zugeordnet sind. EBCDIC

Die Zeichenzuordnungen zwischen EBCDIC Codepages und Unicode-Codepunkten basieren auf Tabellen, die von veröffentlicht wurden. IBM Der komplette Satz steht IBM als komprimierte Datei zum Herunterladen zur Verfügung. RDSfor Postgre SQL verwendete diese Zuordnungen mit den von ihnen bereitgestellten Tools, ICU um die in den Tabellen in diesem Abschnitt aufgeführten Sortierungen zu erstellen. Die Sortierungsnamen enthalten eine Sprache und ein Land, wie es von der verlangt wird. ICU In EBCDIC Codepages werden jedoch keine Sprachen angegeben, und einige EBCDIC Codepages decken mehrere Länder ab. Das bedeutet, dass der Sprach- und Länderteil der Sortierungsnamen in der Tabelle willkürlich sind und nicht mit dem aktuellen Gebietsschema übereinstimmen müssen. Mit anderen Worten, die Codepage-Nummer ist der wichtigste Teil des Sortierungsnamens in dieser Tabelle. Sie können jede der in den folgenden Tabellen aufgelisteten Sortierungen in einer beliebigen RDS for Postgre-Datenbank verwenden. SQL

  • Unicode to EBCDIC collations table— Einige Mainframe-Datenmigrationstools verwenden LATIN1 oder intern, um Daten zu kodieren und LATIN9 zu verarbeiten. Solche Tools verwenden Roundtrip-Schemata, um die Datenintegrität zu wahren und die umgekehrte Konvertierung zu unterstützen. Die Sortierungen in dieser Tabelle können von Tools verwendet werden, die Daten mithilfe von LATIN1 Kodierung verarbeiten, was keine besondere Behandlung erfordert.

  • Unicode to LATIN9 collations table— Sie können diese Kollationen in jeder beliebigen Datenbank RDS für SQL Postgre verwenden.

In der folgenden Tabelle finden Sie Kollationen, die RDS für Postgre verfügbar sind und Codepages SQL EBCDIC Unicode-Codepunkten zuordnen. Es wird empfohlen, die Sortierungen in dieser Tabelle für die Anwendungsentwicklung zu verwenden, für die eine Sortierung auf der Grundlage der Reihenfolge der IBM Codepages erforderlich ist.

Name der Postgre-Sortierung SQL Beschreibung der Code-Page-Zuordnung und Sortierreihenfolge

DA-DK-CP277-x-Intensivstation

Unicode-Zeichen, die direkt der IBM EBCDIC Codepage 277 (gemäß den Konvertierungstabellen) zugeordnet sind, werden in der Reihenfolge der IBM CP 277-Codepunkte sortiert

de-DE-cp273-x-icu

Unicode-Zeichen, die direkt der IBM EBCDIC Codepage 273 (gemäß den Konvertierungstabellen) zugeordnet sind, werden in der Reihenfolge der IBM CP 273-Codepunkte sortiert

en-GB-cp285-x-icu

Unicode-Zeichen, die direkt der IBM EBCDIC Codepage 285 (gemäß den Konvertierungstabellen) zugeordnet sind, werden in der Reihenfolge der IBM CP 285-Codepunkte sortiert

en-US-cp037-x-icu

Unicode-Zeichen, die direkt der IBM EBCDIC Codepage 037 (gemäß den Konvertierungstabellen) zugeordnet sind, werden in der Reihenfolge der IBM CP 37-Codepunkte sortiert

es-ES-cp284-x-icu

Unicode-Zeichen, die direkt der IBM EBCDIC Codepage 284 (gemäß den Konvertierungstabellen) zugeordnet sind, werden in der Reihenfolge der IBM CP 284-Codepunkte sortiert

fi-FI-cp278-x-icu

Unicode-Zeichen, die direkt der IBM EBCDIC Codepage 278 (gemäß den Konvertierungstabellen) zugeordnet sind, werden in der Reihenfolge der IBM CP 278-Codepunkte sortiert

fr-FR-cp297-x-icu

Unicode-Zeichen, die direkt der IBM EBCDIC Codepage 297 (gemäß den Konvertierungstabellen) zugeordnet sind, werden in der Reihenfolge der IBM CP 297-Codepunkte sortiert

it-IT-cp280-x-icu

Unicode-Zeichen, die direkt der IBM EBCDIC Codepage 280 (gemäß den Konvertierungstabellen) zugeordnet sind, werden in der Reihenfolge der IBM CP 280-Codepunkte sortiert

nl-BE-cp500-x-icu

Unicode-Zeichen, die direkt der IBM EBCDIC Codepage 500 (gemäß den Konvertierungstabellen) zugeordnet sind, werden in der Reihenfolge der IBM CP 500-Codepunkte sortiert

Amazon RDS bietet eine Reihe zusätzlicher Sortierungen, die Unicode-Codepunkte, die LATIN9 Zeichen anhand der von veröffentlichten Tabellen zugeordnet sindIBM, in der Reihenfolge der ursprünglichen Codepunkte gemäß der EBCDIC Codepage der Quelldaten sortieren.

Name der Postgre-Sortierung SQL Beschreibung der Code-Page-Zuordnung und Sortierreihenfolge

DA-DK-CP1142 m-x-icu

Unicode-Zeichen, die den ursprünglich aus der IBM EBCDIC Codepage 1142 (gemäß den Konvertierungstabellen) konvertierten LATIN9 Zeichen zugeordnet sind, werden in der Reihenfolge der CP-1142-Codepunkte sortiert IBM

DE-DE-CP1141 m-x-icu

Unicode-Zeichen, die den ursprünglich aus der IBM EBCDIC Codepage 1141 (gemäß den Konvertierungstabellen) konvertierten LATIN9 Zeichen zugeordnet sind, werden in der Reihenfolge der CP-1141-Codepunkte IBM sortiert

de-GB-CP1146 m-x-icu

Unicode-Zeichen, die den ursprünglich aus der IBM EBCDIC Codepage 1146 (gemäß den Konvertierungstabellen) konvertierten LATIN9 Zeichen zugeordnet sind, werden in der Reihenfolge der CP-1146-Codepunkte sortiert IBM

en-US-CP1140 m-x-icu

Unicode-Zeichen, die den ursprünglich aus der IBM EBCDIC Codepage 1140 (gemäß den Konvertierungstabellen) konvertierten LATIN9 Zeichen zugeordnet sind, werden in IBM der Reihenfolge der CP 1140-Codepunkte sortiert

es-ES-CP1145 m-x-icu

Unicode-Zeichen, die den ursprünglich aus der IBM EBCDIC Codepage 1145 (gemäß den Konvertierungstabellen) konvertierten LATIN9 Zeichen zugeordnet sind, werden in der Reihenfolge der CP-1145-Codepunkte IBM sortiert

fi-FI-CP1143 m-x-icu

Unicode-Zeichen, die den ursprünglich aus der IBM EBCDIC Codepage 1143 (gemäß den Konvertierungstabellen) konvertierten LATIN9 Zeichen zugeordnet sind, werden in der Reihenfolge der CP-1143-Codepunkte sortiert IBM

fr-FR-CP1147 m-x-icu

Unicode-Zeichen, die den ursprünglich aus der IBM EBCDIC Codepage 1147 (gemäß den Konvertierungstabellen) konvertierten LATIN9 Zeichen zugeordnet sind, werden in der Reihenfolge der CP-1147-Codepunkte sortiert IBM

it-IT-CP1144 m-x-icu

Unicode-Zeichen, die den ursprünglich aus der IBM EBCDIC Codepage 1144 (gemäß den Konvertierungstabellen) konvertierten LATIN9 Zeichen zugeordnet sind, werden in der Reihenfolge der CP-1144-Codepunkte IBM sortiert

nl-BE-CP1148 m-x-icu

Unicode-Zeichen, die den ursprünglich aus der IBM EBCDIC Codepage 1148 (gemäß den Konvertierungstabellen) konvertierten LATIN9 Zeichen zugeordnet sind, werden in der Reihenfolge der CP-1148-Codepunkte sortiert IBM

Im Folgenden finden Sie ein Beispiel für die Verwendung einer RDS for SQL Postgre-Kollatierung.

db1=> SELECT pg_import_system_collations('pg_catalog'); pg_import_system_collations ----------------------------- 36 db1=> SELECT '¤' < 'a' col1; col1 ------ t db1=> SELECT '¤' < 'a' COLLATE "da-DK-cp277-x-icu" col1; col1 ------ f

Es wird empfohlen, die Sortierungen in den Unicode to EBCDIC collations table und in der für die Anwendungsentwicklung zu verwenden, Unicode to LATIN9 collations table für die eine Sortierung auf der Grundlage der Reihenfolge der IBM Codepages erforderlich ist. Die folgenden Sortierungen (mit dem Suffix „b“) sind auch in sichtbarpg_collation, sind aber für die Verwendung durch Mainframe-Datenintegrations- und Migrationstools vorgesehen. Sie ordnen Codepages bestimmten Codepunktverschiebungen zu und erfordern eine besondere Behandlung bei AWS der Sortierung. Mit anderen Worten: Die folgenden Sortierungen werden nicht empfohlen.

  • DA-DK-277 b-x-icu

  • DA-DK-1142 b-x-icu

  • DE-DE-CP273 b-x-icu

  • DE-DE-CP1141 b-x-icu

  • de-GB-CP1146 b-x-icu

  • de-GB-CP285 b-x-icu

  • de-US-CP037 b-x-icu

  • de-US-CP1140 b-x-icu

  • es-ES-CP1145 b-x-icu

  • Es-ES-CP284 b-x-icu

  • fi-FI-CP1143 b-x-icu

  • fr-FR-CP1147 b-x-icu

  • fr-FR-CP297 b-x-icu

  • it-IT-CP1144 b-x-icu

  • it-IT-CP280 b-x-icu

  • NL-BE-CP1148 b-x-icu

  • NL-BE-CP500 b-x-icu

Weitere Informationen zur Migration von Anwendungen aus Mainframe-Umgebungen zu finden Sie unter Was ist Mainframe-Modernisierung AWS? AWS .

Weitere Informationen zur Verwaltung von Kollationen in Postgre SQL finden Sie unter Collation Support in der Postgre-Dokumentation. SQL