

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Kolasi RDS for PostgreSQL untuk EBCDIC dan migrasi mainframe lainnya
<a name="PostgreSQL.Collations.mainframe.migration"></a>

RDS for PostgreSQL versi 10 dan yang lebih tinggi termasuk ICU versi 60.2, yang didasarkan pada Unicode 10.0 dan mencakup kolasi dari Unicode Common Locale Data Repository, CLDR 32. Pustaka internasionalisasi perangkat lunak ini memastikan bahwa pengodean karakter disajikan secara konsisten, terlepas dari sistem operasi atau platform. Untuk informasi selengkapnya tentang Unicode CLDR-32, lihat [CLDR 32 Release Note](https://cldr.unicode.org/index/downloads/cldr-32) di situs web Unicode CLDR. Anda dapat mempelajari lebih lanjut tentang komponen internasionalisasi untuk Unicode (ICU) di situs web [ICU Technical Committee (ICU-TC)](https://icu.unicode.org/home). Untuk informasi tentang ICU-60, lihat [Download ICU 60](https://icu.unicode.org/download/60). 

Mulai dari versi 14.3, RDS for PostgreSQL juga mencakup kolasi yang membantu integrasi data dan konversi dari sistem berbasis EBCDIC. Kode pertukaran desimal kode biner yang diperluas atau pengodean *EBCDIC* biasanya digunakan oleh sistem operasi mainframe. Kolasi yang disediakan Amazon RDS ini didefinisikan secara sempit untuk hanya mengurutkan karakter Unicode yang langsung dipetakan ke halaman kode EBCDIC. Karakter diurutkan dalam urutan titik kode EBCDIC untuk memungkinkan validasi data setelah konversi. Kolasi ini tidak menyertakan formulir denormalisasi, juga tidak menyertakan karakter Unicode yang tidak langsung memetakan ke karakter di halaman kode EBCDIC sumber.

Pemetaan karakter antara halaman kode EBCDIC dan titik kode Unicode didasarkan pada tabel yang diterbitkan oleh IBM. Set lengkap tersedia dari IBM sebagai [file terkompresi](http://download.boulder.ibm.com/ibmdl/pub/software/dw/java/cdctables.zip) yang dapat diunduh. RDS for PostgreSQL menggunakan pemetaan ini dengan alat yang disediakan oleh ICU untuk membuat kolasi yang tercantum dalam tabel di bagian ini. Nama kolasi mencakup bahasa dan negara seperti yang dipersyaratkan oleh ICU. Namun, halaman kode EBCDIC tidak menentukan bahasa, dan beberapa halaman kode EBCDIC mencakup beberapa negara. Itu artinya porsi bahasa dan negara dari nama kolasi dalam tabel bersifat arbitrer, dan tidak perlu cocok dengan lokal saat ini. Dengan kata lain, nomor halaman kode adalah bagian terpenting dari nama kolasi dalam tabel ini. Anda dapat menggunakan kolasi apa pun yang tertera dalam tabel berikut di basis data RDS for PostgreSQL. 
+ [Unicode to EBCDIC collations table](#ebcdic-table)Beberapa alat migrasi data mainframe secara internal menggunakan LATIN1 atau LATIN9 untuk menyandikan dan memproses data. Alat tersebut menggunakan skema pulang-pergi untuk menjaga integritas data dan mendukung konversi terbalik. Kumpulan dalam tabel ini dapat digunakan oleh alat yang memproses data menggunakan LATIN1 pengkodean, yang tidak memerlukan penanganan khusus. 
+ [Unicode to LATIN9 collations table](#latin9-table)— Anda dapat menggunakan kolasi ini di RDS apa pun untuk basis data PostgreSQL. 

 

Dalam tabel berikut, ada kolasi yang tersedia di RDS for PostgreSQL yang memetakan halaman kode EBCDIC ke titik kode Unicode. Kami menyarankan Anda menggunakan kolasi dalam tabel ini untuk pengembangan aplikasi yang memerlukan pengurutan berdasarkan urutan halaman kode IBM. <a name="ebcdic-table"></a>


| Nama kolasi PostgreSQL | Deskripsi pemetaan halaman kode dan pengurutan urutan | 
| --- | --- | 
| da-DK-cp277-x-icu | Karakter Unicode yang langsung memetakan ke Kode EBCDIC IBM Halaman 277 (sesuai tabel konversi) diurutkan dalam urutan titik kode IBM CP 277 | 
| de-DE-cp273-x-icu | Karakter Unicode yang langsung memetakan ke Kode EBCDIC IBM Halaman 273 (sesuai tabel konversi) diurutkan dalam urutan titik kode IBM CP 273 | 
| en-GB-cp285-x-icu | Karakter Unicode yang langsung memetakan ke Kode EBCDIC IBM Halaman 285 (sesuai tabel konversi) diurutkan dalam urutan titik kode IBM CP 285 | 
| en-US-cp037-x-icu | Karakter Unicode yang langsung memetakan ke Kode EBCDIC IBM Halaman 037 (sesuai tabel konversi) diurutkan dalam urutan titik kode IBM CP 37 | 
| es-ES-cp284-x-icu | Karakter Unicode yang langsung memetakan ke Kode EBCDIC IBM Halaman 284 (sesuai tabel konversi) diurutkan dalam urutan titik kode IBM CP 284 | 
| fi-FI-cp278-x-icu | Karakter Unicode yang langsung memetakan ke Kode EBCDIC IBM Halaman 278 (sesuai tabel konversi) diurutkan dalam urutan titik kode IBM CP 278 | 
| fr-FR-cp297-x-icu | Karakter Unicode yang langsung memetakan ke Kode EBCDIC IBM Halaman 297 (sesuai tabel konversi) diurutkan dalam urutan titik kode IBM CP 297 | 
| it-IT-cp280-x-icu | Karakter Unicode yang langsung memetakan ke Kode EBCDIC IBM Halaman 280 (sesuai tabel konversi) diurutkan dalam urutan titik kode IBM CP 280 | 
| nl-BE-cp500-x-icu | Karakter Unicode yang langsung memetakan ke Kode EBCDIC IBM Halaman 500 (sesuai tabel konversi) diurutkan dalam urutan titik kode IBM CP 500 | 

Amazon RDS menyediakan satu set kumpulan tambahan yang mengurutkan titik kode Unicode yang dipetakan ke LATIN9 karakter menggunakan tabel yang diterbitkan oleh IBM, dalam urutan titik kode asli sesuai dengan halaman kode EBCDIC dari data sumber. <a name="latin9-table"></a>


| Nama kolasi PostgreSQL | Deskripsi pemetaan halaman kode dan pengurutan urutan | 
| --- | --- | 
| DA-DK-CP1142 m-x-icu | Karakter unicode yang dipetakan ke LATIN9 karakter yang awalnya dikonversi dari IBM EBCDIC Code Page 1142 (per tabel konversi) diurutkan dalam urutan titik kode IBM CP 1142 | 
| De-De-CP1141 m-x-icu | Karakter unicode yang dipetakan ke LATIN9 karakter yang awalnya dikonversi dari IBM EBCDIC Code Page 1141 (per tabel konversi) diurutkan dalam urutan titik kode IBM CP 1141 | 
| EN-GB-CP1146 m-x-icu | Karakter unicode yang dipetakan ke LATIN9 karakter yang awalnya dikonversi dari IBM EBCDIC Code Page 1146 (per tabel konversi) diurutkan dalam urutan titik kode IBM CP 1146 | 
| en-AS-CP1140 m-x-icu | Karakter unicode yang dipetakan ke LATIN9 karakter yang awalnya dikonversi dari IBM EBCDIC Code Page 1140 (per tabel konversi) diurutkan dalam urutan titik kode IBM CP 1140 | 
| ES-ES-CP1145 m-x-icu | Karakter unicode yang dipetakan ke LATIN9 karakter yang awalnya dikonversi dari IBM EBCDIC Code Page 1145 (per tabel konversi) diurutkan dalam urutan titik kode IBM CP 1145 | 
| fi-fi-CP1143 m-x-icu | Karakter unicode yang dipetakan ke LATIN9 karakter yang awalnya dikonversi dari IBM EBCDIC Code Page 1143 (per tabel konversi) diurutkan dalam urutan titik kode IBM CP 1143 | 
| fr-FR-CP1147 m-x-icu | Karakter unicode yang dipetakan ke LATIN9 karakter yang awalnya dikonversi dari IBM EBCDIC Code Page 1147 (per tabel konversi) diurutkan dalam urutan titik kode IBM CP 1147 | 
| IT-IT-CP1144 m-x-icu | Karakter unicode yang dipetakan ke LATIN9 karakter yang awalnya dikonversi dari IBM EBCDIC Code Page 1144 (per tabel konversi) diurutkan dalam urutan titik kode IBM CP 1144 | 
| nl-BE-CP1148 m-x-icu | Karakter unicode yang dipetakan ke LATIN9 karakter yang awalnya dikonversi dari IBM EBCDIC Code Page 1148 (per tabel konversi) diurutkan dalam urutan titik kode IBM CP 1148 | 

Berikut ini, Anda dapat menemukan contoh penggunaan RDS untuk kolasi PostgreSQL.

```
db1=> SELECT pg_import_system_collations('pg_catalog');
 pg_import_system_collations
-----------------------------
                          36
db1=> SELECT '¤' < 'a' col1;
 col1
------
 t  
db1=> SELECT '¤' < 'a' COLLATE "da-DK-cp277-x-icu" col1;
 col1
------
 f
```

Kami menyarankan Anda menggunakan kolasi di [Unicode to EBCDIC collations table](#ebcdic-table) dan di [Unicode to LATIN9 collations table](#latin9-table) untuk pengembangan aplikasi yang memerlukan pengurutan berdasarkan urutan halaman kode IBM. Kumpulan berikut (akhiran dengan huruf “b”) juga terlihat di`pg_collation`, tetapi dimaksudkan untuk digunakan oleh integrasi data mainframe dan alat migrasi di AWS halaman kode peta dengan pergeseran titik kode tertentu dan memerlukan penanganan khusus dalam pemeriksaan. Dengan kata lain, penggunaan kolasi berikut tidak direkomendasikan. 
+ DA-DK-277 b-x-icu
+ DA-DK-1142 b-x-icu
+ De-de-CP273 b-x-icu
+ De-De-CP1141 b-x-icu
+ EN-GB-CP1146 b-x-icu
+ EN-GB-CP285 b-x-icu
+ id-US-CP037 b-x-icu
+ en-AS-CP1140 b-x-icu
+ ES-ES-CP1145 b-x-icu
+ es-ES-CP284 b-x-icu
+ fi-fi-CP1143 b-x-icu
+ fr-FR-CP1147 b-x-icu
+ FR-FR-CP297 b-x-icu
+ IT-IT-CP1144 b-x-icu
+ IT-IT-CP280 b-x-icu
+ nl-BE-CP1148 b-x-icu
+ NL-BE-CP500 b-x-icu

Untuk mempelajari lebih lanjut tentang memigrasi aplikasi dari lingkungan mainframe ke AWS, lihat [Apa itu Modernisasi AWS Mainframe](https://docs.aws.amazon.com/m2/latest/userguide/what-is-m2.html)? .

Untuk mempelajari selengkapnya tentang mengelola kolasi PostgreSQL, lihat [Collation Support](https://www.postgresql.org/docs/current/collation.html) dalam dokumentasi PostgreSQL.