Pelacakan target - Amazon Comprehend

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pelacakan target

Dengan pelacakan target, Anda dapat menyesuaikan penyediaan titik akhir agar sesuai dengan kebutuhan kapasitas berdasarkan penggunaan. Jumlah unit inferensi secara otomatis menyesuaikan sehingga kapasitas yang digunakan berada dalam persentase target dari kapasitas yang disediakan. Anda dapat menggunakan pelacakan target untuk mengakomodasi lonjakan penggunaan sementara untuk titik akhir klasifikasi dokumen dan titik akhir pengenal entitas. Untuk informasi lebih lanjut, lihat Kebijakan penskalaan pelacakan target untuk Application Auto Scaling.

catatan

Contoh berikut diformat untuk Unix, Linux, dan macOS. Untuk Windows, ganti karakter kelanjutan backslash (\) Unix di akhir setiap baris dengan tanda sisipan (^).

Menyiapkan pelacakan target

Untuk menyiapkan pelacakan target untuk titik akhir, Anda menggunakan AWS CLI perintah untuk mendaftarkan target yang dapat diskalakan dan kemudian membuat kebijakan penskalaan. Target yang dapat diskalakan mendefinisikan unit inferensi sebagai sumber daya yang digunakan untuk menyesuaikan penyediaan titik akhir, dan kebijakan penskalaan mendefinisikan metrik yang mengontrol penskalaan otomatis kapasitas yang disediakan.

Untuk mengatur pelacakan target
  1. Daftarkan target yang dapat diskalakan. Contoh berikut mendaftarkan target yang dapat diskalakan untuk menyesuaikan penyediaan titik akhir dengan kapasitas minimum 1 unit inferensi dan kapasitas maksimum 2 unit inferensi.

    Untuk titik akhir klasifikasi dokumen, gunakan AWS CLI perintah berikut:

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2

    Untuk titik akhir pengenal entitas, gunakan perintah berikut: AWS CLI

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2
  2. Untuk memverifikasi pendaftaran target yang dapat diskalakan, gunakan AWS CLI perintah berikut:

    aws application-autoscaling describe-scalable-targets \ --service-namespace comprehend \ --resource-id endpoint ARN
  3. Buat konfigurasi pelacakan target untuk kebijakan penskalaan dan simpan konfigurasi dalam file bernamaconfig.json. Berikut ini adalah contoh konfigurasi pelacakan target untuk titik akhir klasifikasi dokumen yang menargetkan menjaga InferenceUtilization metrik pada 70%.

    { "TargetValue": 70, "CustomizedMetricSpecification": { "MetricName": "InferenceUtilization", "Namespace": "MyNamespace", "Dimensions": [ { "Name": "EndpointArn", "Value": "arn:aws:comprehend:region:account-id:document-classifier-endpoint/name" } ], "Statistic": "Sum", "Unit": "Percent" } }

    Berikut ini adalah contoh untuk titik akhir pengenal entitas:

    { "TargetValue": 70, "CustomizedMetricSpecification": { "MetricName": "InferenceUtilization", "Namespace": "MyNamespace", "Dimensions": [ { "Name": "EndpointArn", "Value": "arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name" } ], "Statistic": "Sum", "Unit": "Percent" } }
  4. Buat kebijakan penskalaan. Contoh berikut membuat kebijakan penskalaan berdasarkan konfigurasi pelacakan target yang ditentukan dalam config.json file.

    Untuk titik akhir klasifikasi dokumen, gunakan AWS CLI perintah berikut:

    aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json

    Untuk titik akhir pengenal entitas, gunakan perintah berikut: AWS CLI

    aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json

Pertimbangan

Pertimbangan berikut berlaku saat menggunakan pelacakan target dengan titik akhir Comprehend:

  • Metrik titik akhir dipancarkan hanya untuk permintaan yang berhasil. Metrik tidak akan muncul untuk permintaan yang dibatasi atau gagal dengan kesalahan server internal atau kesalahan pelanggan.

  • Ketika titik data hilang, status CloudWatch alarm dukungan akan berubah menjadiINSUFFICIENT_DATA . Ketika ini terjadi, Application Auto Scaling tidak dapat menskalakan titik akhir Anda.

  • Matematika metrik dapat membantu untuk mengatasi batasan ini. Misalnya, untuk menggunakan nilai 0 ketika tidak ada metrik yang dilaporkan, gunakan FILL(m1,0) fungsi di m1 mana metrik. Penting untuk menguji konfigurasi Anda untuk memastikannya berperilaku seperti yang diharapkan. Lihat Membuat kebijakan pelacakan target menggunakan matematika metrik untuk opsi lebih lanjut.

Menghapus pelacakan target

Untuk menghapus pelacakan target untuk titik akhir, Anda menggunakan AWS CLI perintah untuk menghapus kebijakan penskalaan dan kemudian membatalkan pendaftaran target yang dapat diskalakan.

Untuk menghapus pelacakan target
  1. Hapus kebijakan penskalaan. Contoh berikut menghapus kebijakan penskalaan yang ditentukan.

    Untuk titik akhir klasifikasi dokumen, gunakan AWS CLI perintah berikut:

    aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \

    Untuk titik akhir pengenal entitas, gunakan perintah berikut: AWS CLI

    aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy
  2. Batalkan pendaftaran target yang dapat diskalakan. Contoh berikut membatalkan pendaftaran target terukur yang ditentukan.

    Untuk titik akhir klasifikasi dokumen, gunakan AWS CLI perintah berikut:

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits

    Untuk titik akhir pengenal entitas, gunakan perintah berikut: AWS CLI

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits