Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pelacakan target
Dengan pelacakan target, Anda dapat menyesuaikan penyediaan titik akhir agar sesuai dengan kebutuhan kapasitas berdasarkan penggunaan. Jumlah unit inferensi secara otomatis menyesuaikan sehingga kapasitas yang digunakan berada dalam persentase target dari kapasitas yang disediakan. Anda dapat menggunakan pelacakan target untuk mengakomodasi lonjakan penggunaan sementara untuk titik akhir klasifikasi dokumen dan titik akhir pengenal entitas. Untuk informasi lebih lanjut, lihat Kebijakan penskalaan pelacakan target untuk Application Auto Scaling.
catatan
Contoh berikut diformat untuk Unix, Linux, dan macOS. Untuk Windows, ganti karakter kelanjutan backslash (\) Unix di akhir setiap baris dengan tanda sisipan (^).
Menyiapkan pelacakan target
Untuk menyiapkan pelacakan target untuk titik akhir, Anda menggunakan AWS CLI perintah untuk mendaftarkan target yang dapat diskalakan dan kemudian membuat kebijakan penskalaan. Target yang dapat diskalakan mendefinisikan unit inferensi sebagai sumber daya yang digunakan untuk menyesuaikan penyediaan titik akhir, dan kebijakan penskalaan mendefinisikan metrik yang mengontrol penskalaan otomatis kapasitas yang disediakan.
Untuk mengatur pelacakan target
-
Daftarkan target yang dapat diskalakan. Contoh berikut mendaftarkan target yang dapat diskalakan untuk menyesuaikan penyediaan titik akhir dengan kapasitas minimum 1 unit inferensi dan kapasitas maksimum 2 unit inferensi.
Untuk titik akhir klasifikasi dokumen, gunakan AWS CLI perintah berikut:
aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:document-classifier-endpoint/name
\ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2Untuk titik akhir pengenal entitas, gunakan perintah berikut: AWS CLI
aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:entity-recognizer-endpoint/name
\ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2 -
Untuk memverifikasi pendaftaran target yang dapat diskalakan, gunakan AWS CLI perintah berikut:
aws application-autoscaling describe-scalable-targets \ --service-namespace comprehend \ --resource-id
endpoint ARN
-
Buat konfigurasi pelacakan target untuk kebijakan penskalaan dan simpan konfigurasi dalam file bernama
config.json
. Berikut ini adalah contoh konfigurasi pelacakan target untuk titik akhir klasifikasi dokumen yang menargetkan menjaga InferenceUtilization metrik pada 70%.{ "TargetValue": 70, "CustomizedMetricSpecification": { "MetricName": "InferenceUtilization", "Namespace": "MyNamespace", "Dimensions": [ { "Name": "EndpointArn", "Value": "arn:aws:comprehend:
region
:account-id
:document-classifier-endpoint/name
" } ], "Statistic": "Sum", "Unit": "Percent" } }Berikut ini adalah contoh untuk titik akhir pengenal entitas:
{ "TargetValue": 70, "CustomizedMetricSpecification": { "MetricName": "InferenceUtilization", "Namespace": "MyNamespace", "Dimensions": [ { "Name": "EndpointArn", "Value": "arn:aws:comprehend:
region
:account-id
:entity-recognizer-endpoint/name
" } ], "Statistic": "Sum", "Unit": "Percent" } } -
Buat kebijakan penskalaan. Contoh berikut membuat kebijakan penskalaan berdasarkan konfigurasi pelacakan target yang ditentukan dalam
config.json
file.Untuk titik akhir klasifikasi dokumen, gunakan AWS CLI perintah berikut:
aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:document-classifier-endpoint/name
\ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-nameTestPolicy
\ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.jsonUntuk titik akhir pengenal entitas, gunakan perintah berikut: AWS CLI
aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:entity-recognizer-endpoint/name
\ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-nameTestPolicy
\ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json
Pertimbangan
Pertimbangan berikut berlaku saat menggunakan pelacakan target dengan titik akhir Comprehend:
-
Metrik titik akhir dipancarkan hanya untuk permintaan yang berhasil. Metrik tidak akan muncul untuk permintaan yang dibatasi atau gagal dengan kesalahan server internal atau kesalahan pelanggan.
-
Ketika titik data hilang, status CloudWatch alarm dukungan akan berubah menjadi
INSUFFICIENT_DATA
. Ketika ini terjadi, Application Auto Scaling tidak dapat menskalakan titik akhir Anda. -
Matematika metrik dapat membantu untuk mengatasi batasan ini. Misalnya, untuk menggunakan nilai 0 ketika tidak ada metrik yang dilaporkan, gunakan
FILL(m1,0)
fungsi dim1
mana metrik. Penting untuk menguji konfigurasi Anda untuk memastikannya berperilaku seperti yang diharapkan. Lihat Membuat kebijakan pelacakan target menggunakan matematika metrik untuk opsi lebih lanjut.
Menghapus pelacakan target
Untuk menghapus pelacakan target untuk titik akhir, Anda menggunakan AWS CLI perintah untuk menghapus kebijakan penskalaan dan kemudian membatalkan pendaftaran target yang dapat diskalakan.
Untuk menghapus pelacakan target
-
Hapus kebijakan penskalaan. Contoh berikut menghapus kebijakan penskalaan yang ditentukan.
Untuk titik akhir klasifikasi dokumen, gunakan AWS CLI perintah berikut:
aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:document-classifier-endpoint/name
\ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-nameTestPolicy
\Untuk titik akhir pengenal entitas, gunakan perintah berikut: AWS CLI
aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:entity-recognizer-endpoint/name
\ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-nameTestPolicy
-
Batalkan pendaftaran target yang dapat diskalakan. Contoh berikut membatalkan pendaftaran target terukur yang ditentukan.
Untuk titik akhir klasifikasi dokumen, gunakan AWS CLI perintah berikut:
aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:document-classifier-endpoint/name
\ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnitsUntuk titik akhir pengenal entitas, gunakan perintah berikut: AWS CLI
aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:
region
:account-id
:entity-recognizer-endpoint/name
\ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits