Cara kerja registri skema - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Cara kerja registri skema

Bagian ini menjelaskan bagaimana proses serialisasi dan deserialisasi dalam registri skema bekerja.

  1. Mendaftar skema: Jika skema belum ada di registri, maka skema dapat didaftarkan dengan nama skema yang sama dengan nama tujuan (misalnya, test_topic, test_stream, prod_firehose) atau produsen dapat memberikan nama kustom untuk skema tersebut. Produsen juga dapat menambahkan pasangan kunci-nilai ke skema sebagai metadata, seperti sumber: MSK_KAFKA_TOPIC_A, atau menerapkan tag ke skema pada pembuatan skema. AWS Setelah sebuah skema terdaftar, Registri Skema mengembalikan skema ID versi ke pen-serialisasi. Jika skema ada tetapi pen-serialisasi menggunakan versi baru yang tidak ada, maka Registri Skema akan memeriksa referensi skema untuk aturan kompatibilitas untuk memastikan bahwa versi baru sudah kompatibel sebelum mendaftarkannya sebagai sebuah versi baru.

    Ada dua metode untuk mendaftarkan sebuah skema: registrasi manual dan registrasi otomatis. Anda dapat mendaftarkan skema secara manual melalui AWS Glue konsol atauCLI/SDK.

    Ketika pendaftaran otomatis diaktifkan dalam pengaturan serializer, pendaftaran otomatis skema akan dilakukan. Jika REGISTRY_NAME tidak disediakan dalam konfigurasi produsen, maka pendaftaran otomatis akan mendaftarkan versi skema baru di bawah registri default (default-registry). Lihat Instalasi SerDe Perpustakaan untuk informasi tentang menentukan properti pendaftaran otomatis.

  2. Serializer memvalidasi catatan data terhadap skema: Ketika aplikasi yang memproduksi data telah terdaftar skemanya, serializer Registri Skema memvalidasi rekaman yang dihasilkan oleh aplikasi terstruktur dengan bidang dan jenis data yang cocok dengan skema terdaftar. Jika skema catatan tidak cocok dengan skema terdaftar, maka serializer akan mengembalikan pengecualian dan aplikasi akan gagal untuk memberikan catatan ke tujuan.

    Jika tidak ada skema dan jika nama skema tidak disediakan melalui konfigurasi produser, maka skema dibuat dengan nama yang sama dengan nama topik (jika Apache Kafka atau MSK Amazon) atau nama aliran (jika Kinesis Data Streams).

    Setiap catatan memiliki sebuah definisi skema dan data. Definisi skema tersebut di-kueri terhadap skema dan versi yang ada di Registri Skema.

    Secara default, produsen cache definisi skema dan versi IDs skema skema terdaftar. Jika definisi versi skema catatan tidak cocok dengan apa yang tersedia dalam cache, maka produsen akan mencoba untuk memvalidasi skema dengan Registri Skema. Jika versi skema valid, maka ID versi dan definisi skema akan di-cache secara lokal pada produsen.

    Anda dapat menyesuaikan periode cache default (24 jam) dalam properti produsen opsional di langkah #3 dari Instalasi SerDe Perpustakaan.

  3. Serialisasi dan kirimkan catatan: Jika rekaman sesuai dengan skema, serializer menghiasi setiap rekaman dengan ID versi skema, membuat serial rekaman berdasarkan format data yang dipilih (,, Protobuf, atau format lain segera hadir) AVROJSON, mengompres catatan (konfigurasi produsen opsional), dan mengirimkannya ke tujuan.

  4. Konsumen melakukan deserialisasi data: Konsumen membaca data ini menggunakan perpustakaan deserializer Registri Skema yang mem-parsing ID versi skema dari muatan catatan.

  5. Deserializer dapat meminta skema dari Registri Skema: Jika ini adalah pertama kalinya deserializer melihat catatan dengan ID versi skema tertentu, dengan menggunakan ID versi skema, deserializer akan meminta skema dari Registri Skema dan meng-cache skema tersebut secara lokal pada konsumen. Jika Registri Skema tidak dapat melakukan deserialisasi catatan, konsumen dapat mencatat log data dari catatan dan melanjutkan, atau menghentikan aplikasi.

  6. Deserializer menggunakan skema untuk melakukan deserialisasi catatan: Ketika deserializer mengambil ID versi skema dari Registri Skema, deserializer melakukan dekompresi catatan (jika catatan yang dikirim oleh produsen dikompresi) dan menggunakan skema tersebut untuk melakukan deserialisasi catatan. Aplikasi sekarang memproses catatan tersebut.

catatan

Enkripsi: Klien Anda berkomunikasi dengan Schema Registry melalui API panggilan yang mengenkripsi data dalam perjalanan menggunakan TLS enkripsi melalui. HTTPS Skema yang disimpan dalam Schema Registry selalu dienkripsi saat istirahat menggunakan kunci AWS Key Management Service service-managed ().AWS KMS

catatan

Otorisasi Pengguna: Registri Skema mendukung kebijakan berbasis identitasIAM.