

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Amazon DataZone mulai cepat dengan data AWS Glue
<a name="quickstart-glue"></a>

Selesaikan langkah-langkah mulai cepat berikut untuk menjalankan alur kerja produsen data dan konsumen data lengkap di Amazon DataZone dengan data AWS Glue sampel. 

**Topics**
+ [Langkah 1 - Buat DataZone domain Amazon dan portal data](#create-domain-gs-glue)
+ [Langkah 2 - Buat proyek penerbitan](#create-publishing-project-gs-glue)
+ [Langkah 3 - Ciptakan lingkungan](#create-environment-gs-glue)
+ [Langkah 4 - Menghasilkan data untuk penerbitan](#produce-data-for-publishing-gs-glue)
+ [Langkah 5 - Kumpulkan metadata dari Glue AWS](#gather-metadata-from-glue-gs-glue)
+ [Langkah 6 - Kurasi dan publikasikan aset data](#curate-data-asset-gs-glue)
+ [Langkah 7 - Buat proyek untuk analisis data](#create-project-for-data-analysis-gs-glue)
+ [Langkah 8 - Buat lingkungan untuk analisis data](#create-environment-gs2-glue)
+ [Langkah 9 - Cari katalog data dan berlangganan data](#search-catalog-subscribe-gs-glue)
+ [Langkah 10 - Menyetujui permintaan berlangganan](#approve-subscription-request-gs-glue)
+ [Langkah 11 - Buat kueri dan analisis data di Amazon Athena](#analyze-data-gs-glue)

## Langkah 1 - Buat DataZone domain Amazon dan portal data
<a name="create-domain-gs-glue"></a>

Bagian ini menjelaskan langkah-langkah membuat DataZone domain Amazon dan portal data untuk alur kerja ini.

Selesaikan prosedur berikut untuk membuat DataZone domain Amazon. Untuk informasi selengkapnya tentang DataZone domain Amazon, lihat[DataZone Terminologi dan konsep Amazon](datazone-concepts.md). 

1. **Arahkan ke DataZone konsol Amazon di [https://console.aws.amazon.com/datazone](https://console.aws.amazon.com/datazone), masuk, lalu pilih Buat domain.** 
**catatan**  
Jika Anda ingin menggunakan DataZone domain Amazon yang ada untuk alur kerja ini, pilih **Lihat domain**, lalu pilih domain yang ingin Anda gunakan, lalu lanjutkan ke Langkah 2 membuat proyek penerbitan.

1. Pada halaman **Buat domain**, berikan nilai untuk bidang berikut: 
   + **Nama** - tentukan nama untuk domain Anda. Untuk keperluan alur kerja ini, Anda dapat menghubungi **pemasaran** domain ini.
   + **Deskripsi** - tentukan deskripsi domain opsional.
   + **Enkripsi data** - data Anda dienkripsi secara default dengan kunci yang AWS memiliki dan mengelola untuk Anda. Untuk kasus penggunaan ini, Anda dapat meninggalkan pengaturan enkripsi data default.

     Untuk informasi selengkapnya tentang menggunakan kunci terkelola pelanggan, lihat[Enkripsi data saat istirahat untuk Amazon DataZone](encryption-rest-datazone.md). Jika Anda menggunakan kunci KMS Anda sendiri untuk enkripsi data, Anda harus menyertakan pernyataan berikut dalam default [AmazonDataZoneDomainExecutionRole](AmazonDataZoneDomainExecutionRole.md) Anda.

------
#### [ JSON ]

****  

     ```
     {
         "Version":"2012-10-17",		 	 	 
         "Statement": [
             {
                 "Sid": "Statement1",
                 "Effect": "Allow",
                 "Action": [
                     "kms:Decrypt",
                     "kms:DescribeKey",
                     "kms:GenerateDataKey"
                 ],
                 "Resource": [
                     "arn:aws:kms:us-east-1:111122223333:key/1234abcd-12ab-34cd-56ef-1234567890ab"
                 ]
             }
         ]
     }
     ```

------
   + **Akses layanan** - biarkan yang dipilih secara default **Gunakan opsi peran default** tidak berubah.
**catatan**  
Jika Anda menggunakan DataZone domain Amazon yang ada untuk alur kerja ini, Anda dapat memilih opsi **Gunakan peran layanan yang ada, lalu pilih peran** yang ada dari menu tarik-turun.
   + Di bawah **Pengaturan cepat**, pilih **Siapkan akun ini untuk konsumsi dan penerbitan data**. Opsi ini memungkinkan DataZone cetak biru Amazon bawaan dari **Data lake dan **gudang Data****, dan mengonfigurasi izin yang diperlukan, sumber daya, proyek default, dan data lake default dan profil lingkungan gudang data untuk akun ini. Untuk informasi selengkapnya tentang DataZone cetak biru Amazon, lihat. [DataZone Terminologi dan konsep Amazon](datazone-concepts.md)
   + Simpan kolom yang tersisa di bawah **Detail izin** tidak berubah. 
**catatan**  
Jika Anda memiliki DataZone domain Amazon yang sudah ada, Anda dapat memilih opsi **Gunakan peran layanan yang ada dan kemudian memilih peran** yang ada dari menu tarik-turun untuk peran **Glue Manage Access, peran** **Redshift Manage Access**, **dan** peran Penyediaan. 
   + Jaga agar bidang di bawah **Tag** tidak berubah.
   + Pilih **Create domain** (Buat domain).

1. Setelah domain berhasil dibuat, pilih domain ini, dan pada halaman ringkasan domain, catat **URL portal data** untuk domain ini. Anda dapat menggunakan URL ini untuk mengakses portal DataZone data Amazon Anda untuk menyelesaikan langkah-langkah lainnya dalam alur kerja ini. Anda juga dapat menavigasi ke portal data dengan memilih **Buka portal data**.

**catatan**  
Dalam rilis Amazon saat ini DataZone, setelah domain dibuat, URL yang dihasilkan untuk portal data tidak dapat dimodifikasi.

Pembuatan domain dapat memakan waktu beberapa menit untuk menyelesaikannya. Tunggu domain memiliki status **Tersedia** sebelum melanjutkan ke langkah berikutnya.

## Langkah 2 - Buat proyek penerbitan
<a name="create-publishing-project-gs-glue"></a>

Bagian ini menjelaskan langkah-langkah yang diperlukan untuk membuat proyek penerbitan untuk alur kerja ini.

1. Setelah Anda menyelesaikan Langkah 1 di atas dan membuat domain, Anda akan melihat **Selamat Datang di Amazon DataZone\$1** jendela. Di jendela ini, pilih **Buat proyek**.

1. **Tentukan nama proyek, misalnya, untuk alur kerja ini, Anda dapat menamainya **SalesDataPublishingProject**, lalu biarkan bidang lainnya tidak berubah, lalu pilih Buat.**

## Langkah 3 - Ciptakan lingkungan
<a name="create-environment-gs-glue"></a>

Bagian ini menjelaskan langkah-langkah yang diperlukan untuk membuat lingkungan untuk alur kerja ini.

1. Setelah Anda menyelesaikan Langkah 2 di atas dan membuat proyek Anda, **Anda akan melihat jendela Proyek Anda siap digunakan**. Di jendela ini, pilih **Buat lingkungan**.

1. Pada halaman **Buat lingkungan**, tentukan yang berikut ini dan kemudian pilih **Buat lingkungan**.

1. Tentukan nilai untuk yang berikut:
   + **Nama** - tentukan nama untuk lingkungan. Untuk panduan ini, Anda bisa menyebutnya. `Default data lake environment`
   + **Deskripsi** - tentukan deskripsi untuk lingkungan.
   + **Profil lingkungan** - pilih profil **DataLakeProfile**lingkungan. Ini memungkinkan Anda menggunakan Amazon DataZone dalam alur kerja ini untuk bekerja dengan data di Amazon S3, AWS Glue Catalog, dan Amazon Athena.
   + Untuk panduan ini, jaga agar bidang lainnya tidak berubah.

1. Pilih **Buat lingkungan**.

## Langkah 4 - Menghasilkan data untuk penerbitan
<a name="produce-data-for-publishing-gs-glue"></a>

Bagian ini menjelaskan langkah-langkah yang diperlukan untuk menghasilkan data untuk penerbitan dalam alur kerja ini.

1. Setelah Anda menyelesaikan langkah 3 di atas, dalam `SalesDataPublishingProject` proyek Anda, di panel sebelah kanan, di bawah **alat Analytics**, pilih **Amazon Athena**. Ini membuka editor kueri Athena menggunakan kredensi proyek Anda untuk otentikasi. Pastikan bahwa lingkungan penerbitan Anda dipilih di dropdown ** DataZone lingkungan Amazon** dan `<environment_name>%_pub_db` database dipilih seperti pada editor kueri.

1. Untuk panduan ini, Anda menggunakan skrip kueri **Create Table as Select** (CTAS) untuk membuat tabel baru yang ingin Anda publikasikan ke Amazon. DataZone Di editor kueri Anda, jalankan skrip CTAS ini untuk membuat `mkt_sls_table` tabel yang dapat Anda publikasikan dan sediakan untuk pencarian dan berlangganan. 

   ```
   CREATE TABLE mkt_sls_table AS
   SELECT 146776932 AS ord_num, 23 AS sales_qty_sld, 23.4 AS wholesale_cost, 45.0 as lst_pr, 43.0 as sell_pr, 2.0 as disnt, 12 as ship_mode,13 as warehouse_id, 23 as item_id, 34 as ctlg_page, 232 as ship_cust_id, 4556 as bill_cust_id
   UNION ALL SELECT 46776931, 24, 24.4, 46, 44, 1, 14, 15, 24, 35, 222, 4551
   UNION ALL SELECT 46777394, 42, 43.4, 60, 50, 10, 30, 20, 27, 43, 241, 4565
   UNION ALL SELECT 46777831, 33, 40.4, 51, 46, 15, 16, 26, 33, 40, 234, 4563
   UNION ALL SELECT 46779160, 29, 26.4, 50, 61, 8, 31, 15, 36, 40, 242, 4562
   UNION ALL SELECT 46778595, 43, 28.4, 49, 47, 7, 28, 22, 27, 43, 224, 4555
   UNION ALL SELECT 46779482, 34, 33.4, 64, 44, 10, 17, 27, 43, 52, 222, 4556
   UNION ALL SELECT 46779650, 39, 37.4, 51, 62, 13, 31, 25, 31, 52, 224, 4551
   UNION ALL SELECT 46780524, 33, 40.4, 60, 53, 18, 32, 31, 31, 39, 232, 4563
   UNION ALL SELECT 46780634, 39, 35.4, 46, 44, 16, 33, 19, 31, 52, 242, 4557
   UNION ALL SELECT 46781887, 24, 30.4, 54, 62, 13, 18, 29, 24, 52, 223, 4561
   ```

   Pastikan tabel **mkt\$1sls\$1table** berhasil dibuat di bagian **Tabel dan tampilan di sisi kiri**. Sekarang Anda memiliki aset data yang dapat dipublikasikan ke dalam DataZone katalog Amazon.

## Langkah 5 - Kumpulkan metadata dari Glue AWS
<a name="gather-metadata-from-glue-gs-glue"></a>

Bagian ini menjelaskan langkah pengumpulan metadata dari AWS Glue untuk alur kerja ini.

1. Setelah Anda menyelesaikan langkah 4 di atas, di portal DataZone data Amazon, pilih `SalesDataPublishingProject` proyek, lalu pilih tab **Data**, lalu pilih **Sumber data** di panel sebelah kiri.

1. Pilih sumber yang dibuat sebagai bagian dari proses pembuatan lingkungan. 

1. Pilih **Run** di sebelah menu dropdown **Action** dan kemudian pilih tombol refresh. Setelah sumber data berjalan selesai, aset ditambahkan ke DataZone inventaris Amazon.

## Langkah 6 - Kurasi dan publikasikan aset data
<a name="curate-data-asset-gs-glue"></a>

Bagian ini menjelaskan langkah-langkah kurasi dan penerbitan aset data dalam alur kerja ini.

1. Setelah Anda menyelesaikan langkah 5 di atas, di portal DataZone data Amazon, pilih `SalesDataPublishingProject` proyek yang Anda buat pada langkah sebelumnya, pilih tab **Data**, pilih **Data inventaris** di panel sebelah kiri, dan temukan tabel. `mkt_sls_table`

1. Buka halaman detail `mkt_sls_table` aset untuk melihat nama bisnis yang dibuat secara otomatis. Pilih ikon **metadata yang dihasilkan secara otomatis** untuk melihat nama aset dan kolom yang dibuat secara otomatis. Anda dapat menerima atau menolak setiap nama satu per satu atau memilih **Terima semua** untuk menerapkan nama yang dihasilkan. Secara opsional, Anda juga dapat menambahkan formulir metadata yang tersedia ke aset Anda dan memilih istilah glosarium untuk mengklasifikasikan data Anda.

1. Pilih **Publikasikan aset** untuk mempublikasikan `mkt_sls_table` aset.

## Langkah 7 - Buat proyek untuk analisis data
<a name="create-project-for-data-analysis-gs-glue"></a>

Bagian ini menjelaskan langkah-langkah pembuatan proyek untuk analisis data. Ini adalah awal dari langkah-langkah konsumen data dari alur kerja ini.

1. Setelah Anda menyelesaikan langkah 6 di atas, di portal DataZone data Amazon, pilih **Buat proyek** dari menu drop-down **Project**.

1. **Pada halaman **Buat proyek**, tentukan nama proyek, misalnya, untuk alur kerja ini, Anda dapat menamainya **MarketingDataAnalysisProject**, lalu biarkan bidang lainnya tidak berubah, lalu pilih Buat.**

## Langkah 8 - Buat lingkungan untuk analisis data
<a name="create-environment-gs2-glue"></a>

Bagian ini menjelaskan langkah-langkah menciptakan lingkungan untuk analisis data.

1. Setelah Anda menyelesaikan langkah 7 di atas, di portal DataZone data Amazon, pilih `MarketingDataAnalysisProject` proyek, lalu pilih tab **Lingkungan**, lalu pilih **Buat lingkungan**.

1. Pada halaman **Buat lingkungan**, tentukan yang berikut ini dan kemudian pilih **Buat lingkungan**.
   + **Nama** - tentukan nama untuk lingkungan. Untuk panduan ini, Anda bisa menyebutnya. `Default data lake environment`
   + **Deskripsi** - tentukan deskripsi untuk lingkungan.
   + **Profil lingkungan** - pilih profil **DataLakeProfile**lingkungan bawaan.
   + Untuk panduan ini, jaga agar bidang lainnya tidak berubah.

## Langkah 9 - Cari katalog data dan berlangganan data
<a name="search-catalog-subscribe-gs-glue"></a>

Bagian ini menjelaskan langkah-langkah mencari katalog data dan berlangganan data.

1. Setelah Anda menyelesaikan langkah 8 di atas, di portal DataZone data Amazon, pilih DataZone ikon Amazon, dan di bidang DataZone **Pencarian** Amazon, cari aset data menggunakan kata kunci (misalnya, 'katalog' atau 'penjualan') di bilah **Pencarian** portal data. 

   Jika perlu, terapkan filter atau penyortiran, dan setelah Anda menemukan aset **Data Penjualan Produk**, Anda dapat memilihnya untuk membuka halaman detail aset.

1. Pada halaman detail aset **Data Penjualan Katalog**, pilih **Berlangganan**.

1. **Dalam dialog **Subscribe**, pilih project **MarketingDataAnalysisProject**konsumen Anda dari dropdown, lalu tentukan alasan permintaan berlangganan Anda, lalu pilih Subscribe.**

## Langkah 10 - Menyetujui permintaan berlangganan
<a name="approve-subscription-request-gs-glue"></a>

Bagian ini menjelaskan langkah-langkah menyetujui permintaan berlangganan.

1. Setelah Anda menyelesaikan langkah 9 di atas, di portal DataZone data Amazon, pilih **SalesDataPublishingProject**proyek yang Anda gunakan untuk menerbitkan aset Anda.

1. Pilih tab **Data**, lalu **Data yang dipublikasikan**, lalu pilih **Permintaan masuk**.

1. Sekarang Anda dapat melihat baris untuk permintaan baru yang membutuhkan persetujuan. Pilih **Lihat permintaan**. Berikan alasan untuk persetujuan dan pilih **Menyetujui**.

## Langkah 11 - Buat kueri dan analisis data di Amazon Athena
<a name="analyze-data-gs-glue"></a>

Sekarang setelah Anda berhasil menerbitkan aset ke DataZone katalog Amazon dan berlangganan, Anda dapat menganalisisnya.

1. Di portal DataZone data Amazon, pilih proyek **MarketingDataAnalysisProject**konsumen Anda dan kemudian, dari panel sebelah kanan, di bawah **alat Analytics**, pilih tautan **Data kueri** dengan Amazon Athena. Ini membuka editor kueri Amazon Athena menggunakan kredensi proyek Anda untuk otentikasi. Pilih lingkungan **MarketingDataAnalysisProject**konsumen dari dropdown **Amazon DataZone Environment** di editor kueri dan kemudian pilih proyek Anda `<environment_name>%sub_db` dari dropdown database.

1. Anda sekarang dapat menjalankan kueri pada tabel berlangganan. Anda dapat memilih **tabel dari Tabel dan Tampilan**, dan kemudian memilih **Pratinjau** untuk memiliki pernyataan pilih di editor layar. Jalankan kueri untuk melihat hasilnya. 