Biaya untuk menggunakan Amazon Redshift ML - Amazon Redshift

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Biaya untuk menggunakan Amazon Redshift ML

Dengan Amazon Redshift, Anda dapat memanfaatkan kemampuan pembelajaran mesin untuk mendapatkan wawasan dari data Anda tanpa perlu keahlian rekayasa data atau pembelajaran mesin yang ekstensif. Bagian berikut menjelaskan biaya yang terkait dengan penggunaan Amazon Redshift ML, membantu Anda merencanakan dan mengoptimalkan pengeluaran sambil memanfaatkan integrasi pembelajaran mesin yang kuat ini.

Biaya untuk menggunakan Amazon Redshift MLdengan AI SageMaker

Amazon Redshift MLfor SageMaker AI menggunakan sumber daya cluster yang ada untuk prediksi sehingga Anda dapat menghindari biaya tambahan Amazon Redshift. Tidak ada biaya Amazon Redshift tambahan untuk membuat atau menggunakan model. Prediksi terjadi secara lokal di cluster Redshift Anda, jadi Anda tidak perlu membayar ekstra kecuali Anda perlu mengubah ukuran cluster Anda. Amazon Redshift MLmenggunakan Amazon SageMaker AI untuk melatih model Anda, yang memang memiliki biaya terkait tambahan.

Tidak ada biaya tambahan untuk fungsi prediksi yang berjalan di dalam klaster Amazon Redshift Anda. Pernyataan CREATE MODEL menggunakan Amazon SageMaker AI dan menimbulkan biaya tambahan. Biaya meningkat dengan jumlah sel dalam data pelatihan Anda. Jumlah sel adalah produk dari jumlah catatan (dalam kueri pelatihan atau waktu tabel) dikalikan jumlah kolom. Misalnya, ketika kueri SELECT dari pernyataan CREATE MODEL membuat 10.000 catatan dan 5 kolom, maka jumlah sel yang dibuatnya adalah 50.000.

Dalam beberapa kasus, data pelatihan yang dihasilkan oleh kueri SELECT CREATE MODEL melebihi batas MAX_CELLS yang Anda berikan (atau default 1 juta jika Anda tidak memberikan batas). Dalam kasus ini, CREATE MODEL secara acak memilih kira-kira MAX_CELLS (yaitu catatan “jumlah kolom” dari kumpulan data pelatihan). CREATE MODEL kemudian melakukan pelatihan menggunakan tupel yang dipilih secara acak ini. Pengambilan sampel acak memastikan bahwa kumpulan data pelatihan yang dikurangi tidak memiliki bias apa pun. Dengan demikian, dengan mengatur MAX_CELLS, Anda dapat mengontrol biaya pelatihan Anda.

Saat menggunakan pernyataan CREATE MODEL, Anda dapat menggunakan opsi MAX_CELLS dan MAX_RUNTIME untuk mengontrol biaya, waktu, dan akurasi model potensial.

MAX_RUNTIME menentukan jumlah waktu maksimum yang dapat diambil pelatihan dalam SageMaker AI saat opsi AUTO ON atau OFF digunakan. Pekerjaan pelatihan sering selesai lebih cepat dari MAX_RUNTIME, tergantung pada ukuran kumpulan data. Setelah model dilatih, Amazon Redshift melakukan pekerjaan tambahan di latar belakang untuk mengkompilasi dan menginstal model Anda di cluster Anda. Dengan demikian, CREATE MODEL dapat memakan waktu lebih lama dari MAX_RUNTIME untuk menyelesaikannya. Namun, MAX_RUNTIME membatasi jumlah perhitungan dan waktu yang digunakan dalam SageMaker AI untuk melatih model Anda. Anda dapat memeriksa status model Anda kapan saja menggunakan SHOW MODEL.

Saat Anda menjalankan CREATE MODEL dengan AUTO ON, Amazon Redshift MLmenggunakan SageMaker AI Autopilot untuk secara otomatis dan cerdas menjelajahi berbagai model (atau kandidat) untuk menemukan yang terbaik. MAX_RUNTIME membatasi jumlah waktu dan perhitungan yang dihabiskan. Jika MAX_RUNTIME disetel terlalu rendah, mungkin tidak ada cukup waktu untuk menjelajahi bahkan satu kandidat. Jika Anda melihat kesalahan “Kandidat Autopilot tidak memiliki model,” jalankan kembali CREATE MODEL dengan nilai MAX_RUNTIME yang lebih besar. Untuk informasi selengkapnya tentang parameter ini, lihat MaxAutoMLJobRuntimeInSecondsdi Referensi Amazon SageMaker AI API.

Saat Anda menjalankan CREATE MODEL dengan AUTO OFF, MAX_RUNTIME sesuai dengan batas berapa lama pekerjaan pelatihan dijalankan di AI. SageMaker Pekerjaan pelatihan sering selesai lebih cepat, tergantung pada ukuran kumpulan data dan parameter lain yang digunakan, seperti num_rounds di MODEL_TYPE XGBOOST.

Anda juga dapat mengontrol biaya atau mengurangi waktu pelatihan dengan menentukan nilai MAX_CELLS yang lebih kecil saat Anda menjalankan CREATE MODEL. Sel adalah entri dalam database. Setiap baris sesuai dengan sel sebanyak kolom, yang dapat memiliki lebar tetap atau bervariasi. MAX_CELLS membatasi jumlah sel, dan dengan demikian jumlah contoh pelatihan yang digunakan untuk melatih model Anda. Secara default, MAX_CELLS diatur ke 1 juta sel. Mengurangi MAX_CELLS mengurangi jumlah baris dari hasil kueri SELECT di CREATE MODEL yang diekspor Amazon Redshift dan dikirim SageMaker ke AI untuk melatih model. Mengurangi MAX_CELLS sehingga mengurangi ukuran kumpulan data yang digunakan untuk melatih model baik dengan AUTO ON dan AUTO OFF. Pendekatan ini membantu mengurangi biaya dan waktu untuk melatih model. Untuk melihat informasi tentang pelatihan dan waktu penagihan dari pekerjaan pelatihan tertentu, pilih Pekerjaan pelatihan di Amazon SageMaker AI.

Meningkatkan MAX_RUNTIME dan MAX_CELLS sering meningkatkan kualitas model dengan memungkinkan SageMaker AI untuk mengeksplorasi lebih banyak kandidat. Dengan cara ini, SageMaker AI dapat mengambil lebih banyak waktu untuk melatih setiap kandidat dan menggunakan lebih banyak data untuk melatih model yang lebih baik. Jika Anda ingin iterasi atau eksplorasi kumpulan data yang lebih cepat, gunakan MAX_RUNTIME dan MAX_CELLS yang lebih rendah. Jika Anda ingin meningkatkan akurasi model, gunakan MAX_RUNTIME dan MAX_CELLS yang lebih tinggi.

Untuk informasi selengkapnya tentang biaya yang terkait dengan berbagai nomor sel dan detail uji coba gratis, lihat harga Amazon Redshift.

Biaya untuk menggunakan Amazon Redshift MLdengan Amazon Bedrock

Menggunakan Amazon Redshift MLdengan Amazon Bedrock menimbulkan biaya tambahan. Untuk informasi selengkapnya, lihat Harga Amazon Bedrock.