Prasyarat penskalaan otomatis - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Prasyarat penskalaan otomatis

Sebelum Anda dapat menggunakan penskalaan otomatis, Anda harus sudah membuat titik akhir SageMaker model Amazon. Anda dapat memiliki beberapa versi model untuk titik akhir yang sama. Setiap model disebut sebagai varian produksi (model). Untuk informasi selengkapnya tentang penerapan titik akhir model, lihat. Menyebarkan Model ke SageMaker Layanan Hosting

Untuk mengaktifkan auto scaling untuk model, Anda dapat menggunakan SageMaker konsol, AWS Command Line Interface (AWS CLI), atau AWS SDK melalui Application Auto API Scaling.

  • Jika ini adalah pertama kalinya Anda mengonfigurasi penskalaan untuk model, kami sarankan Anda. Konfigurasikan penskalaan otomatis model dengan konsol

  • Saat menggunakan Application Auto Scaling AWS CLI atau Application Auto ScalingAPI, alurnya adalah mendaftarkan model sebagai target yang dapat diskalakan, menentukan kebijakan penskalaan, dan kemudian menerapkannya. Di SageMaker konsol, di bawah Inferensi di panel navigasi, pilih Endpoints. Temukan nama titik akhir model Anda dan kemudian pilih untuk menemukan nama varian. Anda harus menentukan nama titik akhir dan nama varian untuk mengaktifkan penskalaan otomatis untuk model.

Penskalaan otomatis dimungkinkan oleh kombinasi Amazon SageMaker, Amazon CloudWatch, dan Application Auto APIs Scaling. Untuk informasi tentang izin minimum yang diperlukan, lihat contoh kebijakan berbasis identitas Application Auto Scaling di Panduan Pengguna Application Auto Scaling.

SagemakerFullAccessPolicyIAMKebijakan ini memiliki semua IAM izin yang diperlukan untuk melakukan penskalaan otomatis. Untuk informasi selengkapnya tentang SageMaker IAM izin, lihatCara menggunakan peran SageMaker eksekusi.

Jika Anda mengelola kebijakan izin Anda sendiri, Anda harus menyertakan izin berikut:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "sagemaker:DescribeEndpoint", "sagemaker:DescribeEndpointConfig", "sagemaker:UpdateEndpointWeightsAndCapacities" ], "Resource": "*" }, { "Effect": "Allow", "Action": [ "application-autoscaling:*" ], "Resource": "*" }, { "Effect": "Allow", "Action": "iam:CreateServiceLinkedRole", "Resource": "arn:aws:iam::*:role/aws-service-role/sagemaker.application-autoscaling.amazonaws.com/AWSServiceRoleForApplicationAutoScaling_SageMakerEndpoint", "Condition": { "StringLike": { "iam:AWSServiceName": "sagemaker.application-autoscaling.amazonaws.com" } } }, { "Effect": "Allow", "Action": [ "cloudwatch:PutMetricAlarm", "cloudwatch:DescribeAlarms", "cloudwatch:DeleteAlarms" ], "Resource": "*" } ] }

Peran terkait layanan

Penskalaan otomatis menggunakan peran AWSServiceRoleForApplicationAutoScaling_SageMakerEndpoint terkait layanan. Peran terkait layanan ini memberikan izin Application Auto Scaling untuk menjelaskan alarm kebijakan Anda, memantau tingkat kapasitas saat ini, dan untuk menskalakan sumber daya target. Peran ini dibuat untuk Anda secara otomatis. Agar pembuatan peran otomatis berhasil, Anda harus memiliki izin untuk iam:CreateServiceLinkedRole tindakan tersebut. Untuk informasi selengkapnya, lihat Peran terkait layanan di Panduan Pengguna Application Auto Scaling.