Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
DataZone Mulai cepat Amazon dengan data Amazon Redshift
Selesaikan langkah-langkah mulai cepat berikut untuk menjalankan alur kerja produsen data dan konsumen data lengkap di Amazon DataZone dengan contoh data Amazon Redshift.
Langkah mulai cepat
- Langkah 1 - Buat DataZone domain Amazon dan portal data
- Langkah 2 - Buat proyek penerbitan
- Langkah 3 - Buat lingkungan
- Langkah 4 - Menghasilkan data untuk penerbitan
- Langkah 5 - Kumpulkan metadata dari Amazon Redshift
- Langkah 6 - Kurasi dan publikasikan aset data
- Langkah 7 - Buat proyek untuk analisis data
- Langkah 8 - Buat lingkungan untuk analisis data
- Langkah 9 - Cari katalog data dan berlangganan data
- Langkah 10 - Menyetujui permintaan berlangganan
- Langkah 11 - Buat kueri dan analisis data di Amazon Redshift
Langkah 1 - Buat DataZone domain Amazon dan portal data
Selesaikan prosedur berikut untuk membuat DataZone domain Amazon. Untuk informasi selengkapnya tentang DataZone domain Amazon, lihat DataZone Terminologi dan konsep Amazon.
-
Arahkan ke DataZone konsol Amazon di https://console.aws.amazon.com/datazone
, masuk, lalu pilih Buat domain. catatan
Jika Anda ingin menggunakan DataZone domain Amazon yang ada untuk alur kerja ini, pilih Lihat domain, lalu pilih domain yang ingin Anda gunakan, lalu lanjutkan ke Langkah 2 membuat proyek penerbitan.
-
Pada halaman Buat domain, berikan nilai untuk bidang berikut:
-
Nama - tentukan nama untuk domain Anda. Untuk keperluan alur kerja ini, Anda dapat memanggil domain
Marketing
ini. -
Deskripsi - tentukan deskripsi domain opsional.
-
Enkripsi data - data Anda dienkripsi secara default dengan kunci yang AWS memiliki dan mengelola untuk Anda. Untuk panduan ini, Anda dapat meninggalkan pengaturan enkripsi data default.
Untuk informasi selengkapnya tentang menggunakan kunci yang dikelola pelanggan, lihatEnkripsi data saat istirahat untuk Amazon DataZone. Jika Anda menggunakan KMS kunci Anda sendiri untuk enkripsi data, Anda harus menyertakan pernyataan berikut dalam default AndaAmazonDataZoneDomainExecutionRole.
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "kms:Decrypt", "kms:GenerateDataKey" ], "Resource": "*" } ] }
-
Akses layanan - pilih opsi Gunakan peran layanan khusus dan kemudian pilih AmazonDataZoneDomainExecutionRoledari menu tarik-turun.
-
Di bawah Pengaturan cepat, pilih Siapkan akun ini untuk konsumsi dan penerbitan data. Opsi ini memungkinkan DataZone cetak biru Amazon bawaan dari Data lake dan gudang Data, dan mengonfigurasi izin dan sumber daya yang diperlukan untuk menyelesaikan langkah-langkah lainnya dalam alur kerja ini. Untuk informasi selengkapnya tentang DataZone cetak biru Amazon, lihat. DataZone Terminologi dan konsep Amazon
-
Simpan kolom yang tersisa di bawah Detail izin dan Tag tidak berubah, lalu pilih Buat domain.
-
-
Setelah domain berhasil dibuat, pilih domain ini, dan pada halaman ringkasan domain, catat portal Data URL untuk domain ini. Anda dapat menggunakan ini URL untuk mengakses portal DataZone data Amazon Anda untuk menyelesaikan langkah-langkah lainnya dalam alur kerja ini.
catatan
Dalam rilis Amazon saat ini DataZone, setelah domain dibuat, yang URL dihasilkan untuk portal data tidak dapat dimodifikasi.
Pembuatan domain dapat memakan waktu beberapa menit untuk diselesaikan. Tunggu domain memiliki status Tersedia sebelum melanjutkan ke langkah berikutnya.
Langkah 2 - Buat proyek penerbitan
Bagian berikut menjelaskan langkah-langkah pembuatan proyek penerbitan dalam alur kerja ini.
-
Setelah Anda menyelesaikan Langkah 1, navigasikan ke portal DataZone data Amazon menggunakan portal data URL dan masuk menggunakan single sign-on (SSO) atau AWS IAM kredenal Anda.
-
Pilih Buat proyek, tentukan nama proyek, misalnya, untuk alur kerja ini, Anda dapat menamainya SalesDataPublishingProject, lalu biarkan bidang lainnya tidak berubah, lalu pilih Buat.
Langkah 3 - Buat lingkungan
Bagian berikut menjelaskan langkah-langkah menciptakan lingkungan dalam alur kerja ini.
-
Setelah Anda menyelesaikan Langkah 2, di portal DataZone data Amazon, pilih
SalesDataPublishingProject
proyek yang Anda buat pada langkah sebelumnya, lalu pilih tab Lingkungan, lalu pilih Buat lingkungan. -
Pada halaman Buat lingkungan, tentukan yang berikut ini dan kemudian pilih Buat lingkungan.
-
Nama - tentukan nama untuk lingkungan. Untuk panduan ini, Anda bisa menyebutnya.
Default data warehouse environment
-
Deskripsi - tentukan deskripsi untuk lingkungan.
-
Profil lingkungan - pilih profil DataWarehouseProfilelingkungan.
-
Berikan nama cluster Amazon Redshift Anda, nama database, dan rahasia ARN untuk cluster Amazon Redshift tempat data Anda disimpan.
catatan
Pastikan rahasia Anda di AWS Secrets Manager menyertakan tag berikut (kunci/nilai):
-
Untuk cluster Amazon Redshift - datazone.rs.cluster: <cluster_name:database name>
Untuk grup kerja Amazon Redshift Tanpa Server - datazone.rs.workgroup: <workgroup_name:database_name>
-
AmazonDataZoneProject: <projectID>
-
AmazonDataZoneDomain: <domainID>
Untuk informasi selengkapnya, lihat Menyimpan kredensi database di AWS Secrets Manager.
Pengguna database yang Anda berikan di AWS Secrets Manager harus memiliki izin pengguna super.
-
-
Langkah 4 - Menghasilkan data untuk penerbitan
Bagian berikut menjelaskan langkah-langkah memproduksi data untuk penerbitan dalam alur kerja ini.
-
Setelah Anda menyelesaikan Langkah 3, di portal DataZone data Amazon, pilih
SalesDataPublishingProject
proyek, dan kemudian, di panel sebelah kanan, di bawah alat Analytics, pilih Amazon Redshift. Ini membuka editor kueri Amazon Redshift menggunakan kredensi proyek Anda untuk autentikasi. -
Untuk panduan ini, Anda menggunakan skrip kueri Create Table as Select (CTAS) untuk membuat tabel baru yang ingin Anda publikasikan ke Amazon. DataZone Di editor kueri Anda, jalankan CTAS skrip ini untuk membuat
mkt_sls_table
tabel yang dapat Anda publikasikan dan sediakan untuk pencarian dan berlangganan.CREATE TABLE mkt_sls_table AS SELECT 146776932 AS ord_num, 23 AS sales_qty_sld, 23.4 AS wholesale_cost, 45.0 as lst_pr, 43.0 as sell_pr, 2.0 as disnt, 12 as ship_mode,13 as warehouse_id, 23 as item_id, 34 as ctlg_page, 232 as ship_cust_id, 4556 as bill_cust_id UNION ALL SELECT 46776931, 24, 24.4, 46, 44, 1, 14, 15, 24, 35, 222, 4551 UNION ALL SELECT 46777394, 42, 43.4, 60, 50, 10, 30, 20, 27, 43, 241, 4565 UNION ALL SELECT 46777831, 33, 40.4, 51, 46, 15, 16, 26, 33, 40, 234, 4563 UNION ALL SELECT 46779160, 29, 26.4, 50, 61, 8, 31, 15, 36, 40, 242, 4562 UNION ALL SELECT 46778595, 43, 28.4, 49, 47, 7, 28, 22, 27, 43, 224, 4555 UNION ALL SELECT 46779482, 34, 33.4, 64, 44, 10, 17, 27, 43, 52, 222, 4556 UNION ALL SELECT 46779650, 39, 37.4, 51, 62, 13, 31, 25, 31, 52, 224, 4551 UNION ALL SELECT 46780524, 33, 40.4, 60, 53, 18, 32, 31, 31, 39, 232, 4563 UNION ALL SELECT 46780634, 39, 35.4, 46, 44, 16, 33, 19, 31, 52, 242, 4557 UNION ALL SELECT 46781887, 24, 30.4, 54, 62, 13, 18, 29, 24, 52, 223, 4561
Pastikan tabel mkt_sls_table berhasil dibuat. Sekarang Anda memiliki aset data yang dapat dipublikasikan ke dalam DataZone katalog Amazon.
Langkah 5 - Kumpulkan metadata dari Amazon Redshift
Bagian berikut menjelaskan langkah-langkah pengumpulan metadata dari Amazon Redshift.
-
Setelah Anda menyelesaikan Langkah 4, di portal DataZone data Amazon, pilih
SalesDataPublishingProject
proyek, lalu pilih tab Data, lalu pilih Sumber data. -
Pilih sumber yang dibuat sebagai bagian dari proses pembuatan lingkungan.
-
Pilih Run di sebelah menu dropdown Action dan kemudian pilih tombol refresh. Setelah sumber data berjalan selesai, aset ditambahkan ke DataZone inventaris Amazon.
Langkah 6 - Kurasi dan publikasikan aset data
Bagian berikut menjelaskan langkah-langkah kurasi dan penerbitan aset data dalam alur kerja ini.
-
Setelah Anda menyelesaikan langkah 5, di portal DataZone data Amazon, pilih
SalesDataPublishingProject
proyek, lalu pilih tab Data, pilih Data inventaris, dan temukanmkt_sls_table
tabel. -
Buka halaman detail
mkt_sls_table
aset untuk melihat nama bisnis yang dibuat secara otomatis. Pilih ikon metadata yang dihasilkan secara otomatis untuk melihat nama aset dan kolom yang dibuat secara otomatis. Anda dapat menerima atau menolak setiap nama satu per satu atau memilih Terima semua untuk menerapkan nama yang dihasilkan. Secara opsional, Anda juga dapat menambahkan formulir metadata yang tersedia ke aset Anda dan memilih istilah glosarium untuk mengklasifikasikan data Anda. -
Pilih Publikasikan untuk mempublikasikan
mkt_sls_table
aset.
Langkah 7 - Buat proyek untuk analisis data
Bagian berikut menjelaskan langkah-langkah membuat proyek untuk analisis data dalam alur kerja ini.
-
Setelah Anda menyelesaikan Langkah 6, di portal DataZone data Amazon, pilih Buat proyek.
-
Di halaman Buat proyek, tentukan nama proyek, misalnya, untuk alur kerja ini, Anda dapat menamainya MarketingDataAnalysisProject, lalu biarkan bidang lainnya tidak berubah, lalu pilih Buat.
Langkah 8 - Buat lingkungan untuk analisis data
Bagian berikut menjelaskan langkah-langkah menciptakan lingkungan untuk analisis data dalam alur kerja ini.
-
Setelah Anda menyelesaikan Langkah 7, di portal DataZone data Amazon, pilih
MarketingDataAnalysisProject
proyek yang Anda buat pada langkah sebelumnya, lalu pilih tab Lingkungan, lalu pilih Tambahkan lingkungan. -
Pada halaman Buat lingkungan, tentukan yang berikut ini dan kemudian pilih Buat lingkungan.
-
Nama - tentukan nama untuk lingkungan. Untuk panduan ini, Anda bisa menyebutnya.
Default data warehouse environment
-
Deskripsi - tentukan deskripsi untuk lingkungan.
-
Profil lingkungan - pilih profil DataWarehouseProfilelingkungan.
-
Berikan nama cluster Amazon Redshift Anda, nama database, dan rahasia ARN untuk cluster Amazon Redshift tempat data Anda disimpan.
catatan
Pastikan rahasia Anda di AWS Secrets Manager menyertakan tag berikut (kunci/nilai):
-
Untuk cluster Amazon Redshift - datazone.rs.cluster: <cluster_name:database name>
Untuk grup kerja Amazon Redshift Tanpa Server - datazone.rs.workgroup: <workgroup_name:database_name>
-
AmazonDataZoneProject: <projectID>
-
AmazonDataZoneDomain: <domainID>
Untuk informasi selengkapnya, lihat Menyimpan kredensi database di AWS Secrets Manager.
Pengguna database yang Anda berikan di AWS Secrets Manager harus memiliki izin pengguna super.
-
-
Untuk panduan ini, jaga agar bidang lainnya tidak berubah.
-
Langkah 9 - Cari katalog data dan berlangganan data
Bagian berikut menjelaskan langkah-langkah mencari katalog data dan berlangganan data.
-
Setelah Anda menyelesaikan Langkah 8, di portal DataZone data Amazon, cari aset data menggunakan kata kunci (misalnya, 'katalog' atau 'penjualan') di bilah Pencarian portal data.
Jika perlu, terapkan filter atau penyortiran, dan setelah Anda menemukan aset Data Penjualan Produk, Anda dapat memilihnya untuk membuka halaman detail aset.
-
Pada halaman detail aset Data Penjualan Produk, pilih Berlangganan.
-
Dalam dialog, pilih proyek konsumen Anda dari dropdown, berikan alasan permintaan akses, lalu pilih Berlangganan.
Langkah 10 - Menyetujui permintaan berlangganan
Bagian berikut menjelaskan langkah-langkah menyetujui permintaan berlangganan dalam alur kerja ini.
-
Setelah Anda menyelesaikan Langkah 9, di portal DataZone data Amazon, pilih SalesDataPublishingProjectproyek yang Anda gunakan untuk menerbitkan aset Anda.
-
Pilih tab Data, lalu Data yang dipublikasikan, lalu Permintaan masuk.
-
Pilih tautan permintaan tampilan dan kemudian pilih Menyetujui.
Langkah 11 - Buat kueri dan analisis data di Amazon Redshift
Sekarang setelah Anda berhasil menerbitkan aset ke DataZone katalog Amazon dan berlangganan, Anda dapat menganalisisnya.
-
Di portal DataZone data Amazon, di panel sebelah kanan, klik tautan Amazon Redshift. Ini membuka editor kueri Amazon Redshift menggunakan kredensi proyek untuk otentikasi.
-
Anda sekarang dapat menjalankan kueri (pilih pernyataan) pada tabel berlangganan. Anda dapat mengklik tabel (three-vertical-dots opsi) dan memilih pratinjau untuk memilih pernyataan di layar editor. Jalankan kueri untuk melihat hasilnya.