

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Lakukan analitik lanjutan menggunakan Amazon Redshift ML
<a name="perform-advanced-analytics-using-amazon-redshift-ml"></a>

*Po Hong dan Chyanna Antonio, Amazon Web Services*

## Ringkasan
<a name="perform-advanced-analytics-using-amazon-redshift-ml-summary"></a>

Di Amazon Web Services (AWS) Cloud, Anda dapat menggunakan machine learning Amazon Redshift (Amazon Redshift ML) untuk melakukan analitik ML pada data yang disimpan di kluster Amazon Redshift atau di Amazon Simple Storage Service (Amazon S3). Amazon Redshift MLmendukung pembelajaran yang diawasi, yang biasanya digunakan untuk analitik tingkat lanjut. Kasus penggunaan untuk Amazon Redshift MLmencakup peramalan pendapatan, deteksi penipuan kartu kredit, dan nilai seumur hidup pelanggan (CLV) atau prediksi churn pelanggan.

Amazon Redshift ML memudahkan pengguna database untuk membuat, melatih, dan menerapkan model ML dengan menggunakan perintah SQL standar. Amazon Redshift ML menggunakan Amazon SageMaker Autopilot untuk secara otomatis melatih dan menyetel model ML terbaik untuk klasifikasi atau regresi berdasarkan data Anda, sementara Anda mempertahankan kontrol dan visibilitas.

Semua interaksi antara Amazon Redshift, Amazon S3, dan Amazon diabstraksikan dan SageMaker diotomatisasi. Setelah model ML dilatih dan digunakan, model ini akan tersedia sebagai [fungsi yang ditentukan pengguna](https://docs.aws.amazon.com/redshift/latest/dg/user-defined-functions.html) (UDF) di Amazon Redshift dan dapat digunakan dalam kueri SQL.  

[Pola ini melengkapi [model Create, train, dan deploy ML di Amazon Redshift menggunakan SQL dengan Amazon Redshift](https://aws.amazon.com/blogs/big-data/create-train-and-deploy-machine-learning-models-in-amazon-redshift-using-sql-with-amazon-redshift-ml/) ML dari AWS Blog, [dan Build, train, dan deploy model ML dengan tutorial SageMaker Amazon dari Getting Started](https://aws.amazon.com/getting-started/hands-on/build-train-deploy-machine-learning-model-sagemaker/) Resource Center.](https://aws.amazon.com/getting-started/)

## Prasyarat dan batasan
<a name="perform-advanced-analytics-using-amazon-redshift-ml-prereqs"></a>

**Prasyarat**
+ Akun AWS yang aktif
+ Data yang ada di tabel Amazon Redshift

**Keterampilan**
+ *Keakraban dengan istilah dan konsep yang digunakan oleh Amazon Redshift ML, *termasuk pembelajaran mesin**, pelatihan,* dan prediksi.* Untuk informasi selengkapnya tentang hal ini, lihat [Melatih model ML](https://docs.aws.amazon.com/machine-learning/latest/dg/training-ml-models.html) dalam dokumentasi Amazon Machine Learning (Amazon ML).
+ Pengalaman dengan penyiapan pengguna Amazon Redshift, manajemen akses, dan sintaks SQL standar. Untuk informasi selengkapnya tentang ini, lihat [Memulai Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/gsg/getting-started.html) di dokumentasi Amazon Redshift.
+ Pengetahuan dan pengalaman dengan Amazon S3 dan AWS Identity and Access Management (IAM). 
+ Pengalaman menjalankan perintah di AWS Command Line Interface (AWS CLI) juga bermanfaat tetapi tidak diperlukan. 

**Batasan**
+ Cluster Amazon Redshift dan bucket S3 harus berada di Wilayah AWS yang sama.
+ Pendekatan pola ini hanya mendukung model pembelajaran yang diawasi seperti regresi, klasifikasi biner, dan klasifikasi multikelas. 

## Arsitektur
<a name="perform-advanced-analytics-using-amazon-redshift-ml-architecture"></a>

![\[Alur kerja menunjukkan cara kerja SageMaker Amazon Redshift ML untuk membangun, melatih, dan menerapkan model ML.\]](http://docs.aws.amazon.com/id_id/prescriptive-guidance/latest/patterns/images/pattern-img/3b6a5f49-c647-45f4-940e-b623f989326a/images/36cc39fe-c1f3-4d68-b89e-e636156001a6.png)


Langkah-langkah berikut menjelaskan cara kerja Amazon Redshift ML SageMaker untuk membangun, melatih, dan menerapkan model ML: 

1. Amazon Redshift mengekspor data pelatihan ke bucket S3.

1. SageMaker Autopilot secara otomatis memproses data pelatihan.

1. Setelah `CREATE MODEL` pernyataan dipanggil, Amazon Redshift ML SageMaker digunakan untuk pelatihan.

1. SageMaker Autopilot mencari dan merekomendasikan algoritma ML dan parameter hiper optimal yang mengoptimalkan metrik evaluasi.

1. Amazon Redshift ML mendaftarkan model keluaran keluaran sebagai fungsi SQL di cluster Amazon Redshift.

1. Fungsi model ML dapat digunakan dalam pernyataan SQL. 

**Tumpukan teknologi**
+ Amazon Redshift
+ SageMaker
+ Amazon S3

## Alat
<a name="perform-advanced-analytics-using-amazon-redshift-ml-tools"></a>
+ [Amazon Redshift — Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/dg/welcome.html) adalah layanan pergudangan data tingkat perusahaan, skala petabyte, dan terkelola sepenuhnya.
+ [Amazon Redshift ML](https://docs.aws.amazon.com/redshift/latest/dg/machine_learning.html) — Amazon Redshift machine learning (Amazon Redshift ML) adalah layanan berbasis cloud yang kuat yang memudahkan analis dan ilmuwan data dari semua tingkat keahlian untuk menggunakan teknologi ML.
+ [Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/userguide/Welcome.html) - Amazon Simple Storage Service (Amazon S3) Simple Storage Service adalah penyimpanan untuk internet. 
+ [Amazon SageMaker](https://docs.aws.amazon.com/sagemaker/latest/dg/whatis.html) - SageMaker adalah layanan ML yang dikelola sepenuhnya. 
+ [Amazon SageMaker Autopilot — SageMaker Autopilot](https://docs.aws.amazon.com/sagemaker/latest/dg/autopilot-automate-model-development.html) adalah kumpulan fitur yang mengotomatiskan tugas-tugas utama dari proses pembelajaran mesin otomatis (AutoML).

 

**Kode**

Anda dapat membuat model ML yang diawasi di Amazon Redshift dengan menggunakan kode berikut:

```
"CREATE MODEL customer_churn_auto_model
FROM (SELECT state,
             account_length,
             area_code,
             total_charge/account_length AS average_daily_spend, 
             cust_serv_calls/account_length AS average_daily_cases,
             churn 
      FROM customer_activity
      WHERE  record_date < '2020-01-01' 
     )
TARGET churn
FUNCTION ml_fn_customer_churn_auto
IAM_ROLE 'arn:aws:iam::XXXXXXXXXXXX:role/Redshift-ML'
SETTINGS (
  S3_BUCKET 'your-bucket'
);")
```

**catatan**  
`SELECT`Status dapat merujuk ke tabel reguler Amazon Redshift, tabel eksternal Amazon Redshift Spectrum, atau keduanya.

## Epik
<a name="perform-advanced-analytics-using-amazon-redshift-ml-epics"></a>

### Siapkan kumpulan data pelatihan dan uji
<a name="prepare-a-training-and-test-dataset"></a>


| Tugas | Deskripsi | Keterampilan yang dibutuhkan | 
| --- | --- | --- | 
| Siapkan kumpulan data pelatihan dan uji. | Masuk ke AWS Management Console dan buka SageMaker konsol Amazon. Ikuti instruksi dari tutorial [Build, train, dan deploy model machine learning](https://aws.amazon.com/getting-started/hands-on/build-train-deploy-machine-learning-model-sagemaker/) untuk membuat file.csv atau Apache Parquet yang memiliki kolom label (pelatihan yang *diawasi*) dan tanpa header. Kami menyarankan Anda mengacak dan membagi kumpulan data mentah menjadi satu set pelatihan untuk pelatihan model (70 persen) dan satu set pengujian untuk evaluasi kinerja model (30 persen). | Ilmuwan data | 

### Siapkan dan konfigurasikan tumpukan teknologi
<a name="prepare-and-configure-the-technology-stack"></a>


| Tugas | Deskripsi | Keterampilan yang dibutuhkan | 
| --- | --- | --- | 
| Buat dan konfigurasikan cluster Amazon Redshift. | Di konsol Amazon Redshift, buat cluster sesuai dengan kebutuhan Anda. Untuk informasi selengkapnya tentang ini, lihat [Membuat klaster](https://docs.aws.amazon.com/redshift/latest/dg/tutorial-loading-data-launch-cluster.html) di dokumentasi Amazon Redshift.  Cluster Amazon Redshift harus dibuat dengan jalur pemeliharaan. `SQL_PREVIEW` Untuk informasi selengkapnya tentang trek pratinjau, lihat [Memilih trek pemeliharaan klaster](https://docs.aws.amazon.com/redshift/latest/mgmt/working-with-clusters.html#rs-mgmt-maintenance-tracks) di dokumentasi Amazon Redshift. | DBA, arsitek Cloud | 
| Buat bucket S3 untuk menyimpan data pelatihan dan artefak model. | Di konsol Amazon S3, buat bucket S3 untuk data pelatihan dan pengujian. Untuk informasi selengkapnya tentang membuat bucket S3, lihat [Membuat bucket S3 dari](https://docs.aws.amazon.com/quickstarts/latest/s3backup/step-1-create-bucket.html) AWS Quick Starts. Pastikan cluster Amazon Redshift dan bucket S3 Anda berada di Wilayah yang sama.  | DBA, arsitek Cloud | 
| Buat dan lampirkan kebijakan IAM ke cluster Amazon Redshift. | Buat kebijakan IAM untuk mengizinkan klaster Amazon Redshift SageMaker mengakses dan Amazon S3. Untuk petunjuk dan langkah-langkahnya, lihat [Penyiapan klaster untuk menggunakan Amazon Redshift MLdalam](https://docs.aws.amazon.com/redshift/latest/dg/cluster-setup.html) dokumentasi Amazon Redshift. | DBA, arsitek Cloud | 
| Izinkan pengguna dan grup Amazon Redshift mengakses skema dan tabel. | Berikan izin untuk memungkinkan pengguna dan grup di Amazon Redshift mengakses skema dan tabel internal dan eksternal. Untuk langkah dan petunjuk, lihat [Mengelola izin dan kepemilikan](https://docs.aws.amazon.com/redshift/latest/dg/permissions-ownership.html) di dokumentasi Amazon Redshift. | DBA | 

### Buat dan latih model ML di Amazon Redshift
<a name="create-and-train-the-ml-model-in-amazon-redshift"></a>


| Tugas | Deskripsi | Keterampilan yang dibutuhkan | 
| --- | --- | --- | 
| Buat dan latih model ML di Amazon Redshift. | Buat dan latih model MLmu di Amazon Redshift Ml. Untuk informasi selengkapnya, lihat `CREATE MODEL` pernyataan di dokumentasi Amazon Redshift. | Pengembang, Ilmuwan data | 

### Lakukan inferensi dan prediksi batch di Amazon Redshift
<a name="perform-batch-inference-and-prediction-in-amazon-redshift"></a>


| Tugas | Deskripsi | Keterampilan yang dibutuhkan | 
| --- | --- | --- | 
| Lakukan inferensi menggunakan fungsi model ML yang dihasilkan. | Untuk informasi selengkapnya tentang melakukan inferensi menggunakan fungsi model ML yang dihasilkan, lihat [Prediksi](https://docs.aws.amazon.com/redshift/latest/dg/prediction.html) dalam dokumentasi Amazon Redshift. | Ilmuwan data, Pengguna intelijen bisnis | 

## Sumber daya terkait
<a name="perform-advanced-analytics-using-amazon-redshift-ml-resources"></a>

**Siapkan kumpulan data pelatihan dan uji**
+ [Membangun, melatih, dan menerapkan model pembelajaran mesin dengan Amazon SageMaker](https://aws.amazon.com/getting-started/hands-on/build-train-deploy-machine-learning-model-sagemaker/)

 

**Siapkan dan konfigurasikan tumpukan teknologi**
+ [Membuat cluster Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/dg/tutorial-loading-data-launch-cluster.html)
+ [Memilih trek pemeliharaan klaster Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/mgmt/working-with-clusters.html#rs-mgmt-maintenance-tracks)
+ [Membuat bucket S3](https://docs.aws.amazon.com/quickstarts/latest/s3backup/step-1-create-bucket.html)
+ [Menyiapkan klaster Amazon Redshift untuk menggunakan Amazon Redshift ML](https://docs.aws.amazon.com/redshift/latest/dg/cluster-setup.html)
+ [Mengelola izin dan kepemilikan di Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/dg/permissions-ownership.html)

 

**Buat dan latih model ML di Amazon Redshift**
+ [Buat pernyataan MODEL di Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/dg/r_CREATE_MODEL.html#r_simple_create_model) 

 

**Lakukan inferensi dan prediksi batch di Amazon Redshift**
+ [Prediksi di Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/dg/prediction.html) 

 

**Sumber daya lainnya**
+ [Memulai dengan Amazon Redshift Ml](https://docs.aws.amazon.com/redshift/latest/dg/geting-started-machine-learning.html)
+ [Membuat, melatih, dan menerapkan model ML di Amazon Redshift menggunakan SQL dengan Amazon Redshift ML](https://aws.amazon.com/blogs/big-data/create-train-and-deploy-machine-learning-models-in-amazon-redshift-using-sql-with-amazon-redshift-ml/)
+ [Mitra Amazon Redshift](https://aws.amazon.com/redshift/partners/?partner-solutions-cards.sort-by=item.additionalFields.partnerNameLower&partner-solutions-cards.sort-order=aschttps://aws.amazon.com/redshift/partners/?partner-solutions-cards.sort-by=item.additionalFields.partnerNameLower&partner-solutions-cards.sort-order=asc)
+ [Mitra kompetensi pembelajaran mesin AWS](https://aws.amazon.com/machine-learning/partner-solutions/?partner-solutions-cards.sort-by=item.additionalFields.partnerNameLower&partner-solutions-cards.sort-order=asc)