DataZone Terminologi dan konsep Amazon - Amazon DataZone

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

DataZone Terminologi dan konsep Amazon

Amazon DataZone adalah layanan manajemen data yang membuatnya lebih cepat dan lebih mudah bagi Anda untuk membuat katalog, menemukan, berbagi, dan mengatur data yang disimpan di seluruh AWS, di tempat, dan sumber pihak ketiga. Dengan Amazon DataZone, administrator dan pengelola data yang mengawasi aset data organisasi dapat mengelola dan mengatur akses ke data menggunakan kontrol halus. Kontrol ini dirancang untuk memastikan akses dengan tingkat hak istimewa dan konteks yang tepat. Amazon DataZone memudahkan para insinyur, ilmuwan data, manajer produk, analis, dan pengguna bisnis untuk mengakses data di seluruh organisasi sehingga mereka dapat menemukan, menggunakan, dan berkolaborasi untuk memperoleh wawasan berbasis data.

Saat Anda memulai dengan Amazon DataZone, penting bagi Anda untuk memahami konsep, terminologi, dan komponennya.

DataZone Komponen Amazon

Amazon DataZone mencakup empat komponen utama berikut:

  • Katalog data bisnis - Anda dapat menggunakan komponen ini untuk membuat katalog data di seluruh organisasi Anda dengan konteks bisnis dan dengan demikian memungkinkan semua orang di organisasi Anda untuk menemukan dan memahami data dengan cepat.

  • Publikasikan dan berlangganan alur kerja - Anda dapat menggunakan alur kerja otomatis ini untuk mengamankan data antara produsen dan konsumen dengan cara layanan mandiri dan untuk memastikan bahwa setiap orang di organisasi Anda memiliki akses ke data yang tepat untuk tujuan yang tepat.

  • Proyek dan lingkungan

    • Di Amazon, DataZone proyek terdapat pengelompokan orang, aset (data), dan alat berbasis kasus penggunaan bisnis yang digunakan untuk menyederhanakan akses ke analitik. AWS Proyek menyediakan area di mana anggota proyek dapat berkolaborasi, bertukar data, dan berbagi aset. Secara default, proyek dikonfigurasikan sehingga hanya mereka yang secara eksplisit ditambahkan ke proyek yang dapat mengakses data dan alat analitik di dalamnya. Proyek mengelola kepemilikan aset yang dihasilkan sesuai dengan kebijakan proyek untuk diakses konsumen data.

    • Dalam DataZone proyek Amazon, lingkungan adalah kumpulan dari nol atau lebih sumber daya yang dikonfigurasi (misalnya, bucket Amazon S3, AWS Glue database, atau workgroup Amazon Athena) tempat kumpulan prinsipal tertentu (misalnya, pengguna dengan izin kontributor) dapat beroperasi. IAM

  • Portal data (di luar AWS Management Console) - ini adalah aplikasi web berbasis browser di mana pengguna yang berbeda dapat pergi ke katalog, menemukan, mengatur, berbagi, dan menganalisis data dengan cara swalayan. Portal data mengautentikasi pengguna dengan IAM kredensi atau kredensi yang ada dari penyedia identitas Anda melalui. AWS IAM Identity Center

Apa itu DataZone domain Amazon?

Anda dapat menggunakan DataZone domain Amazon untuk mengatur aset, pengguna, dan proyek mereka. Dengan mengaitkan AWS akun tambahan dengan DataZone domain Amazon Anda, Anda dapat mengumpulkan sumber data Anda. Anda kemudian dapat mempublikasikan aset dari sumber data ini ke katalog domain Anda, dengan formulir metadata dan glosarium yang meningkatkan kelengkapan dan kualitas metadata. Anda juga dapat mencari dan menelusuri aset ini untuk melihat data apa yang dipublikasikan di domain. Selain itu, Anda dapat bergabung dengan proyek untuk berkolaborasi dengan pengguna lain, berlangganan aset, dan menggunakan lingkungan proyek untuk mengakses alat analitik, termasuk Amazon Athena dan Amazon Redshift. DataZone Domain Amazon memungkinkan Anda dengan fleksibilitas untuk mencerminkan kebutuhan data dan analitik struktur organisasi Anda, baik itu membuat satu DataZone domain Amazon untuk perusahaan Anda atau beberapa DataZone domain Amazon untuk unit bisnis yang berbeda.

Apa itu DataZone proyek dan lingkungan Amazon?

Amazon DataZone memungkinkan tim dan pengguna analitik untuk berkolaborasi dalam proyek dengan membuat pengelompokan tim, alat, dan data berbasis kasus penggunaan.

  • Di Amazon DataZone, proyek memungkinkan sekelompok pengguna untuk berkolaborasi dalam berbagai kasus penggunaan bisnis yang melibatkan penerbitan, penemuan, berlangganan, dan konsumsi data dalam katalog Amazon. DataZone Anggota proyek menggunakan aset dari DataZone katalog Amazon dan menghasilkan aset baru menggunakan satu atau lebih alur kerja analitis. Proyek mendukung kegiatan berikut dalam portal data:

    • Pemilik proyek dapat menambahkan anggota dengan izin pemilik, kontributor, konsumen, pelayan, dan penampil

    • Anggota proyek dapat berupa SSO pengguna, SSO grup, dan IAM pengguna

    • Anggota proyek dapat meminta berlangganan aset dalam katalog data

      Persetujuan berlangganan diberikan untuk proyek

    Buat/hapus proyek

    Buat/hapus profil proyek Buat/hapus profil lingkungan Buat/hapus lingkungan Tambahkan/hapus anggota ke proyek Pencarian dan penemuan Create/delete metadata forms/glossaries Membuat sumber data berjalan dan menelan data Publikasikan data Minta langganan Menyetujui/menolak permintaan berlangganan Baca data berlangganan dari Amazon Athena dan Amazon Redshift
    Pemilik Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Ya Ya Ya Ya Ya Ya Ya Ya
    Kontributor Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Tidak Ya Ya Ya Ya Ya Ya Ya
    Konsumen Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain

    Tidak

    Ya

    Tidak

    Tidak

    Tidak

    Ya

    Tidak

    Ya

    Pemirsa Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain

    Tidak

    Ya

    Tidak

    Tidak

    Tidak

    Tidak

    Tidak

    Ya

    Pramugara Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain

    Tidak

    Ya

    Ya

    Ya

    Ya

    Tidak

    Ya

    Ya

  • Dalam DataZone proyek Amazon, lingkungan adalah kumpulan sumber daya nol atau lebih yang dikonfigurasi (misalnya, Amazon S3, AWS Glue database, atau kelompok kerja Amazon Athena), dengan seperangkat prinsip tertentu yang dapat beroperasi IAM pada sumber daya tersebut. Lingkungan dibuat dengan menggunakan profil lingkungan yang merupakan kumpulan sumber daya dan cetak biru yang telah dikonfigurasi sebelumnya yang menyediakan templat yang dapat digunakan kembali untuk menciptakan lingkungan. Profil lingkungan menentukan pengaturan seperti Akun AWS atau wilayah di mana lingkungan digunakan.

Apa itu DataZone cetak biru Amazon?

Cetak biru yang dengannya lingkungan dibuat mendefinisikan AWS alat dan layanan apa (misalnya, atau Amazon AWS Glue Redshift) anggota proyek tempat lingkungan berada dapat digunakan saat mereka bekerja dengan aset dalam katalog Amazon. DataZone

Dalam rilis Amazon saat ini DataZone, cetak biru default berikut didukung:

Nama cetak biru Deskripsi Sumber daya dibuat
Cetak biru Data Lake

Memungkinkan anggota DataZone proyek Amazon untuk meluncurkan produsen Data Lake dan layanan konsumen di lingkungan.

Sebagai konsumen, ini memungkinkan anggota DataZone proyek Amazon untuk mengakses salinan 'hanya baca' dari aset yang dikelola Lake Formation langsung di Amazon Athena dan di mesin kueri lain yang didukung Lake Formation.

Sebagai produser, ini memungkinkan anggota DataZone proyek Amazon untuk membuat tabel LakeFormation terkelola baru menggunakan Amazon Athena dan mempublikasikannya ke katalog Amazon DataZone.

Memberikan pengguna kemampuan untuk membuat dan menanyakan tabel Lake Formation menggunakan Amazon Athena. Grup kerja Amazon Athena, AWS Glue database dengan izin Formasi Danau 'hanya baca', izin 'hanya IAM baca', dan akses ke Amazon S3 yang dikelola oleh proyek. AWS Glue database dengan 'buat' dan 'berikan' izin Lake Formation, izin 'baca' dan 'tulis'IAM, AWS Glue ETL (ekstrak, ubah, dan muat) dengan penandaan.
Cetak biru Gudang Data

Sebagai konsumen, cetak biru ini memungkinkan anggota DataZone proyek Amazon untuk terhubung ke cluster Amazon Redshift mereka sendiri untuk menanyakan penyimpanan data jarak jauh dan untuk membuat dan menyimpan kumpulan data baru.

Sebagai produser, cetak biru ini memungkinkan anggota DataZone proyek Amazon untuk terhubung ke cluster Amazon Redshift mereka sendiri untuk menanyakan penyimpanan data jarak jauh, untuk membuat kumpulan data baru, dan mempublikasikannya ke katalog Amazon. DataZone

Akses ke editor kueri Amazon Redshift, akses 'baca' ke sumber data berlangganan dari DataZone katalog Amazon, kemampuan untuk membuat aset lokal di cluster Amazon Redshift yang dikonfigurasi. Akses ke editor kueri Amazon Redshift, akses 'baca' ke sumber data berlangganan dari DataZone katalog Amazon, kemampuan untuk membuat dan mempublikasikan aset dari cluster Amazon Redshift yang dikonfigurasi.
Cetak biru Amazon Sagemaker

Cetak biru ini membantu produsen data dan konsumen untuk beralih ke Amazon dengan mulus SageMaker untuk berkolaborasi dalam proyek pembelajaran mesin (ML) sambil menegakkan tata kelola akses ke data dan aset ML. Dengan integrasi bawaan baru antara Amazon DataZone dan Amazon SageMaker, konsumen dan produsen data dapat merampingkan tata kelola ML di seluruh penyiapan infrastruktur, berkolaborasi dalam inisiatif bisnis, dan mengatur data dan aset ML dengan mudah.

Anda dapat membuat SageMaker domain Amazon yang dapat mencari, berlangganan, dan mempublikasikan data dan aset ML di Amazon DataZone. Juga dapat berlangganan dan mempublikasikan ke database AWS Glue dan pembentukan danau seperti yang dikonfigurasi.

Apa itu DataZone inventaris Amazon dan alur kerja penerbitan?

Membuat aset inventaris proyek

Untuk menggunakan Amazon DataZone untuk membuat katalog data Anda, Anda harus terlebih dahulu membawa data (aset) Anda sebagai inventaris proyek Anda di Amazon DataZone. Membuat inventaris untuk sebuah proyek, membuat aset hanya dapat ditemukan oleh anggota proyek itu. Aset inventaris proyek tidak tersedia untuk semua pengguna domain dalam penelusuran/penelusuran kecuali dipublikasikan secara eksplisit. Dalam rilis Amazon saat ini DataZone, Anda dapat menambahkan aset ke inventaris proyek dengan cara berikut:

  • Buat dan jalankan sumber data melalui portal data atau dengan menggunakan Amazon DataZone APIs. Dalam rilis Amazon saat ini DataZone, Anda dapat membuat dan menjalankan sumber data untuk AWS Glue dan Amazon Redshift. Dengan membuat dan menjalankan sumber data AWS Glue atau Amazon Redshift, Anda membuat aset dalam inventaris proyek yang dipilih dan mengimpor metadata teknisnya dari tabel database sumber atau gudang data sebagai inventaris ke Amazon. DataZone

  • Dengan menggunakanAPIs, Anda dapat membuat aset dari jenis aset sistem yang tersedia (AWS Glue, Amazon Redshift, objek Amazon S3) atau dari jenis aset kustom Anda.

    • Buat jenis aset kustom dalam inventaris proyek dengan menggunakan Amazon DataZone APIs. Jenis aset kustom dapat mencakup model ML, dasbor, tabel lokal, dll.

    • Buat aset dari jenis aset kustom ini menggunakan Amazon DataZone APIs.

  • Buat aset untuk objek S3 secara manual menggunakan portal DataZone data Amazon.

Kurasi aset inventaris proyek Anda - setelah membuat inventaris proyek, pemilik data dapat mengkurasi aset inventaris mereka dengan metadata bisnis yang diperlukan dengan menambahkan atau memperbarui nama bisnis (aset dan skema), deskripsi (aset dan skema), baca saya, istilah glosarium (aset dan skema), dan formulir metadata. Anda dapat melakukan ini melalui portal data atau dengan menggunakan Amazon DataZone APIs. Setiap pengeditan aset Anda akan membuat versi inventaris baru.

Menerbitkan aset inventaris proyek ke DataZone katalog Amazon

Langkah selanjutnya menggunakan Amazon DataZone untuk membuat katalog data Anda, adalah membuat aset inventaris proyek Anda dapat ditemukan oleh pengguna domain. Anda dapat melakukan ini dengan menerbitkan aset inventaris ke DataZone katalog Amazon. Hanya versi terbaru dari aset inventaris yang dapat dipublikasikan ke katalog dan hanya versi terbaru yang diterbitkan yang aktif dalam katalog penemuan. Jika aset inventaris diperbarui setelah dipublikasikan ke DataZone katalog Amazon, Anda harus menerbitkannya lagi secara eksplisit agar versi terbaru berada di katalog penemuan. Dalam rilis Amazon saat ini DataZone, Anda dapat mempublikasikan aset inventaris proyek Anda ke DataZone katalog Amazon dengan cara berikut:

  • Publikasikan aset inventaris proyek Anda secara manual ke DataZone katalog Amazon baik melalui portal data atau dengan menggunakan Amazon DataZone APIs.

  • Sebagai bagian dari pembuatan atau pengeditan sumber data, aktifkan Publikasikan aset AWS Glue opsional ke katalog atau Publikasikan aset Amazon Redshift Anda ke pengaturan katalog yang akan digunakan selama sumber data terjadwal atau otomatis berjalan. Saat pengaturan ini diaktifkan, sumber data yang dijalankan akan menambahkan aset ke inventaris proyek Anda dan kemudian juga menerbitkan aset inventaris ke DataZone katalog Amazon. Perhatikan bahwa jika Anda mempublikasikan secara langsung, aset mungkin tidak memiliki metadata bisnis apa pun dan akan dibuat langsung dapat ditemukan oleh semua pengguna domain. Anda dapat menggunakan pengaturan ini pada sumber data Anda baik melalui portal data atau dengan menggunakan Amazon DataZone APIs.

Apa itu alur kerja DataZone langganan dan pemenuhan Amazon?

Setelah aset Anda dipublikasikan ke DataZone katalog Amazon, pengguna domain Anda dapat menemukan aset ini, meminta dan mendapatkan akses ke aset tersebut, dan terus menggunakan Amazon DataZone untuk mengatur, berbagi, dan menganalisis aset tersebut.

Pengguna meminta akses ke aset dengan berlangganan aset tersebut atas nama proyek. Setelah permintaan berlangganan dibuat, pemilik aset mendapatkan pemberitahuan dan dapat meninjau permintaan berlangganan dan memutuskan apakah mereka ingin menyetujui atau menolaknya. Jika permintaan berlangganan disetujui oleh pemilik data, proyek berlangganan diberikan akses ke aset tersebut.

Setelah permintaan berlangganan disetujui, Amazon DataZone memulai alur kerja pemenuhan langganan yang secara otomatis menambahkan aset ke semua lingkungan yang berlaku dalam proyek dengan membuat hibah yang diperlukan di AWS Lake Formation atau Amazon Redshift. Ini memungkinkan anggota proyek berlangganan untuk menanyakan aset menggunakan salah satu alat kueri (Amazon Athena atau editor kueri Amazon Redshift) di lingkungan mereka.

Amazon DataZone dapat memicu logika pemenuhan otomatis ini hanya untuk aset terkelola (ini termasuk tabel AWS Glue dan tabel dan tampilan Amazon Redshift). Untuk semua jenis aset lainnya (aset tidak terkelola), Amazon tidak DataZone dapat secara otomatis memicu pemenuhan melainkan menerbitkan acara di Amazon Eventbridge dengan semua detail yang diperlukan dalam muatan acara sehingga Anda dapat membuat hibah yang diperlukan di luar Amazon. DataZone Amazon DataZone juga menyediakan updateSubscriptionStatus API yang memungkinkan Anda memperbarui status langganan setelah dipenuhi di luar Amazon DataZone sehingga Amazon DataZone dapat memberi tahu anggota proyek bahwa mereka dapat mulai mengkonsumsi aset tersebut.

Persona pengguna Amazon DataZone

Berikut ini adalah persona DataZone pengguna Amazon utama:

  • Administrator domain yang memiliki pengaturan Amazon DataZone sebagai platform analitik untuk organisasi mereka.

    Dalam konteks Amazon DataZone, administrator domain menginstal Amazon DataZone di AWS akun, membuat DataZone domain Amazon, dan mengonfigurasi asosiasi AWS akun dan asosiasi penyedia identitas dengan domain Amazon DataZone . Administrator domain juga menggunakan konsol AWS layanan lain seperti AWS Organization and Service Catalog untuk mengonfigurasi Amazon. DataZone

  • Pengguna data yang merupakan pengguna utama Amazon DataZone (penerbit aset dan pelanggan) untuk tugas analitik dan pembelajaran mesin mereka.

    Pengguna data termasuk pekerja analitik data, ilmuwan data, dan pengguna sistem yang memproduksi dan mengkonsumsi aset data. Dalam konteks Amazon DataZone, pengguna data membuat dan bergabung dengan proyek dan lingkungan, berlangganan dan menggunakan aset data dengan analitik atau alat pembelajaran mesin yang telah dikonfigurasi sebelumnya, dan mempublikasikan aset data keluaran kembali ke katalog DataZone domain Amazon untuk dibagikan kepada orang lain.

  • Pengembang sistem yang membuat templat infrastruktur khusus dan mengintegrasikan Amazon DataZone dengan katalog internal atau sistem produksi.

    Dalam konteks Amazon DataZone, pengembang sistem membangun cetak biru lingkungan (templat infrastruktur) atau pipa Infrastructure-As-Code CI/CD sebagai penyedia Lingkungan, saluran data untuk mempromosikan aset data di seluruh lingkungan, sinkronisasi katalog, dan adaptor pemenuhan hibah berlangganan untuk diintegrasikan dengan katalog internal, atau integrasi antara Amazon DataZone APIs dan antarmuka pengguna internal atau sistem produksi jika diperlukan.

  • Petugas tata kelola data yang memiliki definisi dan risiko keamanan organisasi, privasi, dan kebijakan kepatuhan lainnya dan yang memastikan bahwa penggunaan Amazon DataZone di organisasi mereka sesuai dengan definisi ini.

DataZone Terminologi Amazon

Domain

DataZone Domain Amazon adalah entitas pengorganisasian untuk menghubungkan aset, pengguna, dan proyek Anda. Dengan DataZone domain Amazon, Anda memiliki fleksibilitas untuk mencerminkan kebutuhan data dan analitik struktur organisasi Anda, baik itu membuat satu DataZone domain Amazon untuk perusahaan Anda atau beberapa datazone; domain untuk unit bisnis atau tim yang berbeda.

Satuan domain

Unit domain memungkinkan Anda untuk dengan mudah mengatur aset dan entitas domain lainnya di bawah unit bisnis dan tim tertentu. Untuk menyiapkan berbagi data yang aman dan efisien di dalam dan di seluruh unit bisnis organisasi Anda, Anda dapat membuat unit domain di Amazon DataZone dan memungkinkan pengguna terpilih dalam setiap unit bisnis untuk masuk dan membagikan aset mereka ke katalog. Unit domain juga dapat digunakan untuk memungkinkan pemilik sumber daya, seperti pemilik AWS akun, untuk mengatur DataZone izin otorisasi Amazon pada sumber daya mereka. Unit domain memberikan wewenang yang didelegasikan dari pemilik akun ke pemilik unit domain dan mereka dapat mengatur izin otorisasi pada profil lingkungan (dibuat menggunakan konfigurasi cetak biru), atas nama pemilik akun. Untuk informasi selengkapnya, lihat Unit domain dan kebijakan otorisasi di Amazon DataZone.

Kebijakan otorisasi

Kebijakan DataZone otorisasi Amazon adalah seperangkat kontrol dalam Amazon yang DataZone diterapkan pada entitas seperti proyek, cetak biru, lingkungan, glosarium, dan formulir metadata. Kebijakan ini menentukan siapa yang dapat membuat entitas ini dan mengelola siklus hidupnya di portal Amazon DataZone.

Dalam unit DataZone domain Amazon, Anda dapat menetapkan kebijakan otorisasi berikut kepada pengguna dan grup untuk memberi mereka izin khusus:

  • Kebijakan pembuatan unit domain

  • Kebijakan pembuatan proyek

  • Kebijakan keanggotaan proyek

  • Kebijakan asumsi kepemilikan unit domain

  • Kebijakan asumsi kepemilikan proyek

Untuk informasi selengkapnya, lihat Menetapkan kebijakan otorisasi untuk pengguna dan grup dalam unit domain Amazon DataZone .

Dalam unit DataZone domain Amazon, Anda dapat menetapkan kebijakan otorisasi berikut ke proyek Anda untuk memberikan izin khusus kepada mereka:

  • Kebijakan pembuatan glosarium

  • Kebijakan pembuatan formulir metadata

  • Kebijakan pembuatan jenis aset khusus

Untuk informasi selengkapnya, lihat Menetapkan kebijakan otorisasi untuk proyek dalam unit domain Amazon DataZone .

Dalam konfigurasi cetak biru tertentu, Anda dapat menetapkan kebijakan otorisasi berikut untuk proyek dan pemilik unit domain:

  • Buat profil lingkungan menggunakan cetak biru ini - kebijakan ini dapat ditetapkan ke DataZone proyek Amazon dan mengizinkan mereka untuk membuat profil lingkungan menggunakan cetak biru ini.

  • Berikan izin untuk membuat profil lingkungan menggunakan cetak biru ini - kebijakan ini dapat ditetapkan ke pemilik unit domain dan memberi wewenang kepada mereka untuk memberikan izin kepada proyek untuk membuat profil lingkungan menggunakan cetak biru ini.

Untuk informasi selengkapnya, lihat Tetapkan kebijakan otorisasi dalam konfigurasi cetak biru Amazon DataZone .

Akun terkait

Mengaitkan AWS akun Anda dengan DataZone domain Amazon memungkinkan Anda mempublikasikan data dari AWS akun ini ke dalam DataZone katalog Amazon dan membuat DataZone proyek Amazon agar berfungsi dengan data Anda di beberapa AWS akun. Permintaan asosiasi akun hanya dapat dimulai di AWS akun yang memiliki DataZone domain Amazon. Permintaan asosiasi akun hanya dapat diterima oleh pengguna administratif AWS akun yang diundang. Setelah AWS akun dikaitkan dengan DataZone domain Amazon, Anda dapat mendaftarkan sumber data Anda seperti katalog AWS Glue dan Amazon Redshift di akun ini ke domain ini. Terkait juga memungkinkan AWS akun untuk membuat DataZone proyek dan lingkungan Amazon.

An Akun AWS dapat dikaitkan dengan satu atau lebih DataZone domain Amazon.

Sumber data

Di Amazon DataZone, Anda dapat menggunakan sumber data untuk mengimpor metadata teknis aset (data) dari database sumber atau gudang data ke Amazon. DataZone Dalam rilis Amazon saat ini DataZone, Anda dapat membuat dan menjalankan sumber data untuk AWS Glue dan Amazon Redshift. Dengan membuat sumber data, Anda membuat sambungan antara Amazon DataZone dan sumber (AWS Glue Data Catalog atau Amazon Redshift Warehouse) yang memungkinkan Anda membaca metadata teknis, termasuk nama tabel, nama kolom, dan tipe data. Dengan membuat sumber data, Anda juga memulai proses sumber data awal yang membuat aset baru atau memperbarui aset yang ada di Amazon DataZone. Saat membuat sumber data atau setelah sumber data berhasil dibuat, Anda juga memiliki opsi untuk menentukan jadwal untuk menjalankan sumber data Anda.

Sumber data dijalankan

Di Amazon DataZone, menjalankan sumber data adalah tugas yang DataZone dilakukan Amazon untuk membuat aset dalam inventaris proyek dan juga secara opsional untuk mempublikasikan aset inventaris proyek ke katalog Amazon DataZone . Sumber data berjalan dapat otomatis (dimulai ketika sumber data awalnya dibuat) atau dijadwalkan atau manual. Kriteria pemilihan data memungkinkan Anda menyempurnakan kumpulan data yang ada dan yang akan datang untuk dimasukkan ke dalam inventaris proyek atau DataZone katalog Amazon dan frekuensi pembaruan metadata ke inventaris atau aset katalog tersebut.

Target berlangganan

Di Amazon DataZone, target langganan memungkinkan Anda mengakses data yang telah Anda langgani dalam proyek Anda. Target langganan menentukan lokasi (misalnya, database atau skema) dan izin yang diperlukan (misalnya, IAM peran) yang DataZone dapat digunakan Amazon untuk membuat koneksi dengan data sumber dan untuk membuat hibah yang diperlukan sehingga anggota DataZone proyek Amazon dapat mulai menanyakan data yang telah mereka langgani.

Permintaan berlangganan

Di Amazon DataZone, permintaan berlangganan adalah proses yang harus diikuti oleh DataZone proyek Amazon agar dapat diberikan akses ke aset tertentu. Permintaan berlangganan dapat disetujui, ditolak, dicabut, atau dikabulkan.

Aset

Di Amazon DataZone, aset adalah entitas yang menyajikan objek data fisik tunggal (misalnya, tabel, dasbor, file) atau objek data virtual (misalnya, tampilan).

Jenis aset

Jenis aset menentukan bagaimana aset direpresentasikan dalam DataZone katalog Amazon. Tipe aset mendefinisikan skema untuk jenis aset tertentu. Ketika aset dibuat, mereka divalidasi terhadap skema yang ditentukan oleh jenis aset mereka (secara default, versi terbaru). Saat pembaruan aset terjadi, Amazon DataZone membuat versi aset baru dan memungkinkan DataZone pengguna Amazon beroperasi di semua versi aset.

Glosarium bisnis

Di Amazon DataZone, glosarium bisnis adalah kumpulan istilah bisnis yang mungkin terkait dengan aset. Glosarium bisnis membantu memastikan bahwa istilah dan definisi yang sama digunakan di seluruh organisasi di berbagai tugas analitik datanya.

Istilah dalam glosarium bisnis dapat ditambahkan ke aset dan kolom untuk mengklasifikasikan atau meningkatkan identifikasi atribut tersebut selama pencarian. Glosarium dapat dipilih sebagai tipe nilai untuk bidang dalam bentuk metadata yang terkait dengan aset. Ketika istilah tertentu dipilih sebagai nilai untuk bidang formulir metadata aset, pengguna dapat mencari istilah glosarium bisnis dan menemukan aset terkait.

Jenis bentuk metadata

Jenis formulir metadata adalah templat yang mendefinisikan metadata yang dikumpulkan dan disimpan saat aset dibuat sebagai inventaris atau diterbitkan dalam domain Amazon. DataZone Jenis bentuk metadata dapat dikaitkan dengan aset data. Jenis formulir metadata membantu administrator domain untuk menentukan formulir metadata yang diperlukan untuk domain tersebut seperti informasi kepatuhan, informasi peraturan, atau klasifikasi. Ini memungkinkan administrator domain untuk menyesuaikan metadata tambahan untuk aset mereka. Amazon DataZone memiliki tipe bentuk metadata sistem seperti asset-common-details-form -type, column-business-metadata-form -type,,,, glue-table-form-type glue-view-form-type, s3- redshift-table-form-type redshift-view-form-type, dan. object-collection-form-type subscription-terms-form-type suggestion-form-type

Bentuk metadata

Di Amazon DataZone, formulir metadata menentukan metadata yang dikumpulkan dan disimpan saat aset dibuat sebagai inventaris atau diterbitkan dalam domain Amazon. DataZone Definisi bentuk metadata dibuat dalam domain katalog oleh administrator domain. Definisi bentuk metadata terdiri dari satu atau lebih definisi bidang, dengan dukungan untuk tipe data nilai bidang boolean, date, desimal, integer, string, dan glosarium bisnis.

Administrator domain menerapkan formulir metadata ke aset di domain mereka dengan menambahkan formulir metadata ke domain mereka. Penerbit aset kemudian memberikan nilai bidang opsional dan wajib dalam bentuk metadata.

Proyek

Di Amazon DataZone, proyek memungkinkan sekelompok pengguna untuk berkolaborasi dalam berbagai kasus penggunaan bisnis yang melibatkan pembuatan aset dalam inventaris proyek dan dengan demikian membuatnya dapat ditemukan oleh semua anggota proyek, dan kemudian menerbitkan, menemukan, berlangganan, dan mengkonsumsi aset di katalog Amazon. DataZone Anggota proyek menggunakan aset dari DataZone katalog Amazon dan menghasilkan aset baru menggunakan satu atau lebih alur kerja analitis. Anggota proyek dapat berupa pemilik, kontributor, konsumen, pelayan, dan pemirsa.

Buat/hapus proyek

Buat/hapus profil proyek Buat/hapus profil lingkungan Buat/hapus lingkungan Tambahkan/hapus anggota ke proyek Pencarian dan penemuan Create/delete metadata forms/glossaries Membuat sumber data berjalan dan menelan data Publikasikan data Minta langganan Menyetujui/menolak permintaan berlangganan Baca data berlangganan dari Amazon Athena dan Amazon Redshift
Pemilik Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Ya Ya Ya Ya Ya Ya Ya Ya
Kontributor Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Tidak Ya Ya Ya Ya Ya Ya Ya
Konsumen Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain

Tidak

Ya

Tidak

Tidak

Tidak

Ya

Tidak

Ya

Pemirsa Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain

Tidak

Ya

Tidak

Tidak

Tidak

Tidak

Tidak

Ya

Pramugara Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain Untuk dikelola oleh anggota unit domain

Tidak

Ya

Ya

Ya

Ya

Tidak

Ya

Ya

Pemilik proyek dapat menambah atau menghapus pengguna lain sebagai pemilik atau kontributor dan mereka dapat memodifikasi atau menghapus proyek. Pembatasan lain pada kontributor dapat didefinisikan dengan kebijakan. Ketika pengguna membuat proyek, mereka menjadi pemilik pertama proyek itu.

Environment

Lingkungan adalah kumpulan sumber daya yang dikonfigurasi (misalnya, bucket Amazon S3, AWS Glue database, atau grup kerja Amazon Athena), dengan sekumpulan prinsipal tertentu (dengan izin kontributor yang ditetapkanIAM) yang dapat beroperasi pada sumber daya tersebut. Setiap lingkungan mungkin juga memiliki kepala sekolah pengguna yang berwenang untuk mengakses sumber daya dan mendapatkan akses ke data melalui langganan dan pemenuhan. Lingkungan dirancang untuk menyimpan tautan yang dapat ditindaklanjuti ke dalam AWS layanan dan eksternal IDEs dan konsol. Anggota proyek dapat mengakses layanan seperti konsol Amazon Athena dan lainnya melalui tautan dalam yang dikonfigurasi dalam suatu lingkungan. SSOpengguna dan IAM pengguna dari proyek dapat dicakup lebih lanjut untuk menggunakan/mengakses lingkungan tertentu.

Profil lingkungan

Di Amazon DataZone, profil lingkungan adalah template yang dapat Anda gunakan untuk membuat lingkungan. Profil lingkungan dibuat dengan menggunakan cetak biru.

Dengan profil lingkungan, administrator domain dapat membungkus cetak biru dengan parameter yang telah dikonfigurasi sebelumnya, dan kemudian pekerja data dapat dengan cepat membuat sejumlah lingkungan baru dengan memilih profil lingkungan yang ada dan menentukan nama untuk lingkungan baru. Hal ini memungkinkan pekerja data untuk mengelola proyek dan lingkungan mereka secara efisien sambil memastikan bahwa mereka memenuhi kebijakan tata kelola data yang diberlakukan oleh administrator domain mereka.

Cetak biru

Cetak biru yang dengannya lingkungan dibuat mendefinisikan AWS alat dan layanan apa (misalnya, atau Amazon AWS Glue Redshift) anggota proyek tempat lingkungan berada dapat digunakan saat mereka bekerja dengan aset dalam katalog Amazon. DataZone

Dalam rilis Amazon saat ini DataZone , cetak biru default berikut didukung:

  • Cetak biru danau data

  • Cetak biru gudang data

  • Cetak biru Amazon Sagemaker

Profil pengguna

Profil pengguna mewakili DataZone pengguna Amazon. Amazon DataZone mendukung IAM peran dan SSO identitas untuk berinteraksi dengan Konsol DataZone Manajemen Amazon dan portal data untuk tujuan yang berbeda. Administrator domain menggunakan IAM peran untuk melakukan pekerjaan terkait domain administratif awal di Amazon DataZone Management Console, termasuk membuat DataZone domain Amazon baru, mengonfigurasi jenis formulir metadata, dan menerapkan kebijakan. Pekerja data menggunakan identitas SSO perusahaan mereka melalui Pusat Identitas untuk masuk ke Portal DataZone Data Amazon dan mengakses proyek di mana mereka memiliki keanggotaan.

Profil grup

Profil grup mewakili kelompok DataZone pengguna Amazon. Grup dapat dibuat secara manual, atau dipetakan ke grup Active Directory pelanggan perusahaan. Di Amazon DataZone, grup melayani dua tujuan. Pertama, grup dapat memetakan ke tim pengguna di bagan organisasi, dan dengan demikian mengurangi pekerjaan administratif pemilik DataZone proyek Amazon ketika ada karyawan baru yang bergabung atau meninggalkan tim. Kedua, administrator perusahaan menggunakan grup Active Directory untuk mengelola dan memperbarui status pengguna sehingga administrator DataZone domain Amazon dapat menggunakan keanggotaan grup ini untuk menerapkan kebijakan domain Amazon. DataZone

Administrator domain

Di Amazon DataZone, IAM prinsipal yang membuat DataZone domain Amazon adalah administrator domain default dari domain tersebut. Administrator domain di Amazon DataZone menjalankan fungsionalitas utama untuk domain, termasuk membuat domain, menetapkan administrator domain lain, menambahkan sumber data dan target langganan, membuat proyek dan lingkungan, dan menetapkan pemilik proyek.

Penerbit

Di Amazon DataZone, penerbit mempublikasikan aset ke dalam DataZone katalog Amazon dan dapat mengedit metadata aset yang mereka terbitkan. Jika diberikan otoritas ini, penerbit dapat menyetujui atau menolak permintaan berlangganan ke aset yang mereka terbitkan di katalog Amazon. DataZone

Pelanggan

Di Amazon DataZone, pelanggan adalah DataZone proyek Amazon yang ingin menemukan, mengakses, dan mengkonsumsi aset dalam katalog Amazon DataZone .

Akun AWS pemilik

Di Amazon DataZone, Akun AWS pemilik membuat peran, kebijakan, dan izin di dalamnya Akun AWS yang memungkinkannya dikaitkan dengan DataZone domain Amazon. Akun AWS