Metrik untuk memantau Amazon SageMaker dengan Amazon CloudWatch - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Metrik untuk memantau Amazon SageMaker dengan Amazon CloudWatch

Anda dapat memantau Amazon SageMaker menggunakan Amazon CloudWatch, yang mengumpulkan data mentah dan memprosesnya menjadi metrik yang dapat dibaca, mendekati waktu nyata. Statistik ini disimpan selama 15 bulan. Dengan mereka, Anda dapat mengakses informasi historis dan mendapatkan perspektif yang lebih baik tentang kinerja aplikasi atau layanan web Anda. Namun, CloudWatch konsol Amazon membatasi pencarian ke metrik yang diperbarui dalam 2 minggu terakhir. Batasan ini memastikan bahwa pekerjaan terbaru ditampilkan di namespace Anda.

Untuk membuat grafik metrik tanpa menggunakan pencarian, tentukan nama persisnya di tampilan sumber. Anda juga dapat mengatur alarm yang memperhatikan ambang batas tertentu dan mengirim notifikasi atau mengambil tindakan saat ambang batas tersebut terpenuhi. Untuk informasi selengkapnya, lihat Panduan CloudWatch Pengguna Amazon.

SageMaker metrik pemanggilan titik akhir

AWS/SageMakerNamespace menyertakan metrik permintaan berikut dari panggilan ke. InvokeEndpoint

Metrik tersedia pada frekuensi 1 menit.

Ilustrasi berikut menunjukkan bagaimana SageMaker endpoint berinteraksi dengan Amazon Runtime. SageMaker API Waktu keseluruhan antara mengirim permintaan ke titik akhir dan menerima respons tergantung pada tiga komponen berikut.

  • Latensi jaringan — waktu yang dibutuhkan antara membuat permintaan dan menerima respons kembali dari SageMaker Runtime Runtime. API

  • Latensi overhead — waktu yang diperlukan untuk mengangkut permintaan ke container model dari dan mengangkut respons kembali ke SageMaker Runtime Runtime. API

  • Latensi model — waktu yang dibutuhkan wadah model untuk memproses permintaan dan mengembalikan respons.

Ilustrasi yang menunjukkan bahwa latensi total adalah jumlah latensi jaringan, overhead, dan model.

Untuk informasi selengkapnya tentang latensi total, lihat Praktik terbaik untuk pengujian beban titik akhir inferensi SageMaker real-time Amazon. Untuk informasi tentang berapa lama CloudWatch metrik dipertahankan, lihat GetMetricStatisticsdi Referensi Amazon CloudWatch API.

Metrik Pemanggilan Titik Akhir

Metrik Deskripsi
ConcurrentRequestsPerCopy

Jumlah permintaan bersamaan yang diterima oleh komponen inferensi, dinormalisasi oleh setiap salinan komponen inferensi.

Statistik yang valid: Min, Max

ConcurrentRequestsPerModel

Jumlah permintaan bersamaan yang diterima oleh model.

Statistik yang valid: Min, Max

Invocation4XXErrors

Jumlah InvokeEndpoint permintaan di mana model mengembalikan kode HTTP respons 4xx. Untuk setiap respons 4xx, 1 dikirim; jika tidak, 0 dikirim.

Satuan: Tidak ada

Statistik yang valid: Rata-rata, Jumlah

Invocation5XXErrors

Jumlah InvokeEndpoint permintaan di mana model mengembalikan kode HTTP respons 5xx. Untuk setiap respons 5xx, 1 dikirim; jika tidak, 0 dikirim.

Satuan: Tidak ada

Statistik yang valid: Rata-rata, Jumlah

InvocationModelErrors

Jumlah permintaan pemanggilan model yang tidak menghasilkan respons HTTP 2XX. Ini termasuk kode status 4XX/5XX, kesalahan soket tingkat rendah, respons yang salah, dan batas waktu permintaan. HTTP Untuk setiap respons kesalahan, 1 dikirim; jika tidak, 0 dikirim.

Satuan: Tidak ada

Statistik yang valid: Rata-rata, Jumlah

Invocations

Jumlah InvokeEndpoint permintaan yang dikirim ke titik akhir model.

Untuk mendapatkan jumlah total permintaan yang dikirim ke titik akhir model, gunakan statistik Jumlah.

Satuan: Tidak ada

Statistik yang valid: Jumlah

InvocationsPerCopy

Jumlah pemanggilan dinormalisasi oleh setiap salinan komponen inferensi.

Statistik yang valid: Jumlah

InvocationsPerInstance

Jumlah pemanggilan yang dikirim ke model, dinormalisasi oleh InstanceCount masing-masing ProductionVariant. 1/ numberOfInstances dikirim sebagai nilai pada setiap permintaan. numberOfInstancesadalah jumlah instance aktif untuk di ProductionVariant belakang titik akhir pada saat permintaan.

Satuan: Tidak ada

Statistik yang valid: Jumlah

ModelLatency

Interval waktu yang dibutuhkan oleh model untuk menanggapi API permintaan SageMaker Runtime. Interval ini mencakup waktu komunikasi lokal yang diambil untuk mengirim permintaan dan untuk mengambil respons dari wadah model. Ini juga termasuk waktu yang dibutuhkan untuk menyelesaikan inferensi dalam wadah.

Unit: Mikrodetik

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel

ModelSetupTime

Waktu yang dibutuhkan untuk meluncurkan sumber daya komputasi baru untuk titik akhir tanpa server. Waktu dapat bervariasi tergantung pada ukuran model, berapa lama waktu yang dibutuhkan untuk mengunduh model, dan waktu start-up wadah.

Unit: Mikrodetik

Statistik yang valid: Rata-rata, Min, Maks, Jumlah Sampel, Persentil

OverheadLatency

Interval waktu ditambahkan ke waktu yang dibutuhkan untuk menanggapi permintaan klien dengan biaya SageMaker overhead. Interval ini diukur dari waktu SageMaker menerima permintaan sampai mengembalikan respons ke klien, dikurangiModelLatency. Latensi overhead dapat bervariasi tergantung pada beberapa faktor, termasuk ukuran payload permintaan dan respons, frekuensi permintaan, dan otentikasi/otorisasi permintaan.

Unit: Mikrodetik

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel

Dimensi untuk Metrik Pemanggilan Titik Akhir

Dimensi Deskripsi
EndpointName, VariantName

Memfilter metrik pemanggilan titik akhir untuk titik akhir dan ProductionVariant varian yang ditentukan.

InferenceComponentName

Filter metrik pemanggilan komponen inferensi.

SageMaker metrik komponen inferensi

/aws/sagemaker/InferenceComponentsNamespace menyertakan metrik berikut dari panggilan ke titik akhir yang InvokeEndpointmenghosting komponen inferensi.

Metrik tersedia pada frekuensi 1 menit.

Metrik Deskripsi
CPUUtilizationNormalized

Nilai CPUUtilizationNormalized metrik yang dilaporkan oleh setiap salinan komponen inferensi. Nilai berkisar antara 0% — 100%. Jika Anda menyetel NumberOfCpuCoresRequired parameter dalam pengaturan untuk salinan komponen inferensi, metrik menyajikan pemanfaatan selama reservasi. Jika tidak, metrik menyajikan pemanfaatan di atas batas.

GPUMemoryUtilizationNormalized

Nilai GPUMemoryUtilizationNormalized metrik yang dilaporkan oleh setiap salinan komponen inferensi.

GPUUtilizationNormalized

Nilai GPUUtilizationNormalized metrik yang dilaporkan oleh setiap salinan komponen inferensi. Jika Anda menyetel NumberOfAcceleratorDevicesRequired parameter dalam pengaturan untuk salinan komponen inferensi, metrik menyajikan pemanfaatan selama reservasi. Jika tidak, metrik menyajikan pemanfaatan di atas batas.

MemoryUtilizationNormalized

Nilai yang MemoryUtilizationNormalized dilaporkan oleh setiap salinan komponen inferensi. Jika Anda menyetel MinMemoryRequiredInMb parameter dalam pengaturan untuk salinan komponen inferensi, metrik menyajikan pemanfaatan selama reservasi. Jika tidak, metrik menyajikan pemanfaatan di atas batas.

Dimensi untuk Metrik Komponen Inferensi

Dimensi Deskripsi
InferenceComponentName

Filter metrik komponen inferensi.

SageMaker metrik titik akhir multi-model

AWS/SageMakerNamespace menyertakan metrik pemuatan model berikut dari panggilan ke. InvokeEndpoint

Metrik tersedia pada frekuensi 1 menit.

Untuk informasi tentang berapa lama CloudWatch metrik dipertahankan, lihat GetMetricStatisticsdi Referensi Amazon CloudWatch API.

Metrik Pemuatan Model Titik Akhir Multi-Model

Metrik Deskripsi
ModelLoadingWaitTime

Interval waktu permintaan pemanggilan telah menunggu model target diunduh, dimuat, atau keduanya untuk menjalankan inferensi.

Unit: Mikrodetik

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel

ModelUnloadingTime

Interval waktu yang diperlukan untuk membongkar model melalui UnloadModel API panggilan kontainer.

Unit: Mikrodetik

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel

ModelDownloadingTime

Interval waktu yang dibutuhkan untuk mengunduh model dari Amazon Simple Storage Service (Amazon S3).

Unit: Mikrodetik

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel

ModelLoadingTime

Interval waktu yang diperlukan untuk memuat model melalui LoadModel API panggilan kontainer.

Unit: Mikrodetik

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel

ModelCacheHit

Jumlah InvokeEndpoint permintaan yang dikirim ke titik akhir multi-model yang modelnya sudah dimuat.

Statistik rata-rata menunjukkan rasio permintaan yang modelnya sudah dimuat.

Satuan: Tidak ada

Statistik yang valid: Rata-rata, Jumlah, Jumlah Sampel

Dimensi untuk Metrik Pemuatan Model Titik Akhir Multi-Model

Dimensi Deskripsi
EndpointName, VariantName

Memfilter metrik pemanggilan titik akhir untuk titik akhir dan ProductionVariant varian yang ditentukan.

/aws/sagemaker/EndpointsRuang nama menyertakan metrik instance berikut dari panggilan ke. InvokeEndpoint

Metrik tersedia pada frekuensi 1 menit.

Untuk informasi tentang berapa lama CloudWatch metrik dipertahankan, lihat GetMetricStatisticsdi Referensi Amazon CloudWatch API.

Metrik Instans Model Titik Akhir Multi-Model

Metrik Deskripsi
LoadedModelCount

Jumlah model yang dimuat dalam wadah titik akhir multi-model. Metrik ini dipancarkan per instance.

Statistik rata-rata dengan periode 1 menit memberi tahu Anda jumlah rata-rata model yang dimuat per instance.

Statistik Jumlah memberi tahu Anda jumlah total model yang dimuat di semua instance di titik akhir.

Model yang dilacak metrik ini belum tentu unik karena model mungkin dimuat dalam beberapa wadah di titik akhir.

Satuan: Tidak ada

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel

Dimensi untuk Metrik Pemuatan Model Titik Akhir Multi-Model

Dimensi Deskripsi
EndpointName, VariantName

Memfilter metrik pemanggilan titik akhir untuk titik akhir dan ProductionVariant varian yang ditentukan.

SageMaker pekerjaan dan metrik titik akhir

/aws/sagemaker/EndpointsRuang nama /aws/sagemaker/ProcessingJobs/aws/sagemaker/TrainingJobs,/aws/sagemaker/TransformJobs,, dan menyertakan metrik berikut untuk pekerjaan pelatihan dan instance titik akhir.

Metrik tersedia pada frekuensi 1 menit.

catatan

Amazon CloudWatch mendukung metrik kustom resolusi tinggi dan resolusi terbaiknya adalah 1 detik. Namun, semakin halus resolusinya, semakin pendek umur metrik. CloudWatch Untuk resolusi frekuensi 1 detik, CloudWatch metrik tersedia selama 3 jam. Untuk informasi selengkapnya tentang resolusi dan umur CloudWatch metrik, lihat GetMetricStatisticsdi Referensi Amazon. CloudWatch API

Tip

Untuk membuat profil pekerjaan pelatihan Anda dengan resolusi yang lebih baik hingga perincian 100 milidetik (0,1 detik) dan menyimpan metrik pelatihan tanpa batas waktu di Amazon S3 untuk analisis khusus kapan saja, pertimbangkan untuk menggunakan Amazon Debugger. SageMaker SageMaker Debugger menyediakan aturan bawaan untuk secara otomatis mendeteksi masalah pelatihan umum. Ini mendeteksi masalah pemanfaatan sumber daya perangkat keras (sepertiCPU,GPU, dan kemacetan I/O). Ini juga mendeteksi masalah model non-konvergen (seperti overfit, gradien menghilang, dan tensor yang meledak). SageMaker Debugger juga menyediakan visualisasi melalui Studio Classic dan laporan profilingnya. Untuk menjelajahi visualisasi Debugger, lihat Panduan Dasbor Wawasan SageMaker Debugger, Panduan Laporan Profil Debugger, dan Menganalisis Data Menggunakan Pustaka Klien. SMDebug

Processing Job, Training Job, Batch Transform Job, dan Endpoint Instance Metrics

Metrik Deskripsi
CPUReservation

Jumlah yang CPUs dicadangkan oleh kontainer pada sebuah instance. Nilai berkisar antara 0% — 100%. Dalam pengaturan untuk komponen inferensi, Anda mengatur CPU reservasi dengan NumberOfCpuCoresRequired parameter. Misalnya, jika ada 4CPUs, dan 2 dicadangkan, CPUReservation metriknya adalah 50%.

CPUUtilization Jumlah pemanfaatan masing-masing CPU inti individu. CPUPemanfaatan setiap rentang inti adalah 0-100. Misalnya, jika ada empatCPUs, CPUUtilization kisarannya adalah 0% - 400%. Untuk pekerjaan pemrosesan, nilainya adalah CPU pemanfaatan wadah pemrosesan pada instance.

Untuk pekerjaan pelatihan, nilainya adalah CPU pemanfaatan wadah algoritma pada instance.

Untuk pekerjaan transformasi batch, nilainya adalah CPU pemanfaatan wadah transformasi pada instance.

Untuk varian endpoint, nilainya adalah jumlah dari CPU pemanfaatan wadah primer dan tambahan pada instance.

catatan

Untuk pekerjaan multi-instance, setiap instans melaporkan metrik CPU pemanfaatan. Namun, tampilan default di CloudWatch menunjukkan CPU pemanfaatan rata-rata di semua instance.

Unit: Persen

CPUUtilizationNormalized

Jumlah normalisasi pemanfaatan masing-masing inti individuCPU. Nilai berkisar antara 0% — 100%. Misalnya, jika ada empatCPUs, dan CPUUtilization metriknya 200%, maka CPUUtilizationNormalized metriknya adalah 50%.

DiskUtilization

Persentase ruang disk yang digunakan oleh kontainer pada sebuah instance menggunakan. Kisaran nilai ini adalah 0% - 100%. Metrik ini tidak didukung untuk pekerjaan transformasi batch.

Untuk pekerjaan pemrosesan, nilainya adalah pemanfaatan ruang disk dari wadah pemrosesan pada instance.

Untuk pekerjaan pelatihan, nilainya adalah pemanfaatan ruang disk dari wadah algoritma pada instance.

Untuk varian endpoint, nilainya adalah jumlah dari pemanfaatan ruang disk dari wadah primer dan tambahan pada instance.

Unit: Persen

catatan

Untuk pekerjaan multi-instance, setiap instance melaporkan metrik pemanfaatan disk. Namun, tampilan default CloudWatch menunjukkan pemanfaatan disk rata-rata di semua instance.

GPUMemoryUtilization

Persentase GPU memori yang digunakan oleh kontainer pada sebuah instance. Kisaran nilai adalah 0-100 dan dikalikan dengan jumlah. GPUs Misalnya, jika ada empatGPUs, GPUMemoryUtilization kisarannya adalah 0% - 400%.

Untuk pekerjaan pemrosesan, nilainya adalah pemanfaatan GPU memori dari wadah pemrosesan pada instance.

Untuk pekerjaan pelatihan, nilainya adalah pemanfaatan GPU memori dari wadah algoritma pada instance.

Untuk pekerjaan transformasi batch, nilainya adalah pemanfaatan GPU memori dari wadah transformasi pada instance.

Untuk varian titik akhir, nilainya adalah jumlah dari pemanfaatan GPU memori wadah primer dan tambahan pada instance.

catatan

Untuk pekerjaan multi-instance, setiap instance melaporkan metrik pemanfaatan GPU memori. Namun, tampilan default CloudWatch menunjukkan pemanfaatan GPU memori rata-rata di semua instance.

Unit: Persen

GPUMemoryUtilizationNormalized

Persentase GPU memori yang dinormalisasi yang digunakan oleh kontainer pada sebuah instance. Nilai berkisar antara 0% — 100%. Misalnya, jika ada empatGPUs, dan GPUMemoryUtilization metriknya 200%, maka GPUMemoryUtilizationNormalized metriknya adalah 50%.

GPUReservation

Jumlah yang GPUs dicadangkan oleh kontainer pada sebuah instance. Nilai berkisar antara 0% — 100%. Dalam pengaturan untuk komponen inferensi, Anda mengatur GPU reservasi denganNumberOfAcceleratorDevicesRequired. Misalnya, jika ada 4 GPUs dan 2 yang dicadangkan, GPUReservation metriknya adalah 50%.

GPUUtilization

Persentase GPU unit yang digunakan oleh kontainer pada sebuah instance. Nilai dapat berkisar antara 0-100 dan dikalikan dengan jumlah. GPUs Misalnya, jika ada empatGPUs, GPUUtilization kisarannya adalah 0% - 400%.

Untuk pekerjaan pemrosesan, nilainya adalah GPU pemanfaatan wadah pemrosesan pada instance.

Untuk pekerjaan pelatihan, nilainya adalah GPU pemanfaatan wadah algoritma pada instance.

Untuk pekerjaan transformasi batch, nilainya adalah GPU pemanfaatan wadah transformasi pada instance.

Untuk varian endpoint, nilainya adalah jumlah dari GPU pemanfaatan wadah primer dan tambahan pada instance.

catatan

Untuk pekerjaan multi-instance, setiap instans melaporkan metrik GPU pemanfaatan. Namun, tampilan default di CloudWatch menunjukkan GPU pemanfaatan rata-rata di semua instance.

Unit: Persen

GPUUtilizationNormalized

Persentase GPU unit yang dinormalisasi yang digunakan oleh kontainer pada sebuah instance. Nilai berkisar antara 0% — 100%. Misalnya, jika ada empatGPUs, dan GPUUtilization metriknya 200%, maka GPUUtilizationNormalized metriknya adalah 50%.

MemoryReservation

Jumlah memori yang dicadangkan oleh kontainer pada sebuah instance. Nilai berkisar antara 0% — 100%. Dalam pengaturan untuk komponen inferensi, Anda mengatur reservasi memori dengan MinMemoryRequiredInMb parameter. Misalnya, jika instance 32 GiB memesan 1024 MB, MemoryReservation metriknya adalah 29,8%.

MemoryUtilization

Persentase memori yang digunakan oleh kontainer pada sebuah instance. Kisaran nilai ini adalah 0% - 100%.

Untuk pekerjaan pemrosesan, nilainya adalah pemanfaatan memori dari wadah pemrosesan pada instance.

Untuk pekerjaan pelatihan, nilainya adalah pemanfaatan memori dari wadah algoritma pada instance.

Untuk pekerjaan transformasi batch, nilainya adalah pemanfaatan memori dari wadah transformasi pada instance.

Untuk varian titik akhir, nilainya adalah jumlah dari pemanfaatan memori wadah primer dan tambahan pada instance.

Unit: Persen

catatan

Untuk pekerjaan multi-instance, setiap instance melaporkan metrik pemanfaatan memori. Namun, tampilan default CloudWatch menunjukkan pemanfaatan memori rata-rata di semua instance.

Dimensi untuk Metrik Processing Job, Training Job, dan Batch Transform Job Instance

Dimensi Deskripsi
Host

Untuk memproses pekerjaan, nilai untuk dimensi ini memiliki format[processing-job-name]/algo-[instance-number-in-cluster]. Gunakan dimensi ini untuk memfilter metrik instance untuk pekerjaan pemrosesan dan instance yang ditentukan. Format dimensi ini hanya ada di /aws/sagemaker/ProcessingJobs namespace.

Untuk pekerjaan pelatihan, nilai untuk dimensi ini memiliki format[training-job-name]/algo-[instance-number-in-cluster]. Gunakan dimensi ini untuk memfilter metrik instance untuk pekerjaan dan instance pelatihan yang ditentukan. Format dimensi ini hanya ada di /aws/sagemaker/TrainingJobs namespace.

Untuk pekerjaan transformasi batch, nilai untuk dimensi ini memiliki format[transform-job-name]/[instance-id]. Gunakan dimensi ini untuk memfilter metrik instance untuk pekerjaan dan instance transformasi batch yang ditentukan. Format dimensi ini hanya ada di /aws/sagemaker/TransformJobs namespace.

SageMaker Metrik pekerjaan Inference Recommender

/aws/sagemaker/InferenceRecommendationsJobsNamespace menyertakan metrik berikut untuk pekerjaan rekomendasi inferensi.

Metrik Rekomendasi Inferensi

Metrik Deskripsi
ClientInvocations

Jumlah InvokeEndpoint permintaan yang dikirim ke titik akhir model, seperti yang diamati oleh Inference Recommender.

Satuan: Tidak ada

Statistik yang valid: Jumlah

ClientInvocationErrors

Jumlah InvokeEndpoint permintaan yang gagal, seperti yang diamati oleh Inference Recommender.

Satuan: Tidak ada

Statistik yang valid: Jumlah

ClientLatency

Interval waktu yang dibutuhkan antara mengirim InvokeEndpoint panggilan dan menerima respons seperti yang diamati oleh Inference Recommender. Perhatikan bahwa waktunya dalam milidetik, sedangkan metrik pemanggilan ModelLatency titik akhir dalam mikrodetik.

Unit: Milidetik

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel, Persentil

NumberOfUsers

Jumlah pengguna bersamaan yang mengirim InvokeEndpoint permintaan ke titik akhir model.

Satuan: Tidak ada

Statistik yang valid: Maks, Min, Rata-rata

Dimensi untuk Metrik Pekerjaan Inference Recommender

Dimensi Deskripsi
JobName

Filter metrik pekerjaan Inference Recommender untuk pekerjaan Inference Recommender yang ditentukan.

EndpointName

Filter metrik pekerjaan Inference Recommender untuk titik akhir yang ditentukan.

SageMaker Metrik Ground Truth

Metrik Ground Truth

Metrik Deskripsi
ActiveWorkers

Seorang pekerja aktif tunggal di tim kerja pribadi mengajukan, melepaskan, atau menolak tugas. Untuk mendapatkan jumlah total pekerja aktif, gunakan statistik Jumlah. Ground Truth mencoba menyampaikan setiap ActiveWorkers acara individu satu kali. Jika pengiriman ini tidak berhasil, metrik ini mungkin tidak melaporkan jumlah total pekerja aktif.

Satuan: Tidak ada

Statistik yang valid: Jumlah, Jumlah Sampel

DatasetObjectsAutoAnnotated

Jumlah objek kumpulan data yang dianotasi secara otomatis dalam pekerjaan pelabelan. Metrik ini hanya dipancarkan saat pelabelan otomatis diaktifkan. Untuk melihat kemajuan pekerjaan pelabelan, gunakan metrik Max.

Satuan: Tidak ada

Statistik yang valid: Maks

DatasetObjectsHumanAnnotated

Jumlah objek dataset yang dianotasi oleh manusia dalam pekerjaan pelabelan. Untuk melihat kemajuan pekerjaan pelabelan, gunakan metrik Max.

Satuan: Tidak ada

Statistik yang valid: Maks

DatasetObjectsLabelingFailed

Jumlah objek dataset yang gagal diberi label dalam pekerjaan pelabelan. Untuk melihat kemajuan pekerjaan pelabelan, gunakan metrik Max.

Satuan: Tidak ada

Statistik yang valid: Maks

JobsFailed

Satu pekerjaan pelabelan gagal. Untuk mendapatkan jumlah total pekerjaan pelabelan yang gagal, gunakan statistik Jumlah.

Satuan: Tidak ada

Statistik yang valid: Jumlah, Jumlah Sampel

JobsSucceeded

Pekerjaan pelabelan tunggal berhasil. Untuk mendapatkan jumlah total pekerjaan pelabelan yang berhasil, gunakan statistik Sum.

Satuan: Tidak ada

Statistik yang valid: Jumlah, Jumlah Sampel

JobsStopped

Satu pekerjaan pelabelan dihentikan. Untuk mendapatkan jumlah total pekerjaan pelabelan yang dihentikan, gunakan statistik Jumlah.

Satuan: Tidak ada

Statistik yang valid: Jumlah, Jumlah Sampel

TasksAccepted

Satu tugas diterima oleh seorang pekerja. Untuk mendapatkan jumlah total tugas yang diterima oleh pekerja, gunakan statistik Jumlah. Ground Truth mencoba untuk menyampaikan setiap TaskAccepted peristiwa individu satu kali. Jika pengiriman ini tidak berhasil, metrik ini mungkin tidak melaporkan jumlah total tugas yang diterima.

Satuan: Tidak ada

Statistik yang valid: Jumlah, Jumlah Sampel

TasksDeclined

Satu tugas ditolak oleh seorang pekerja. Untuk mendapatkan jumlah total tugas yang ditolak oleh pekerja, gunakan statistik Jumlah. Ground Truth mencoba untuk menyampaikan setiap TasksDeclined peristiwa individu satu kali. Jika pengiriman ini tidak berhasil, metrik ini mungkin tidak melaporkan jumlah total tugas yang ditolak.

Satuan: Tidak ada

Statistik yang Valid: Jumlah, Jumlah Sampel

TasksReturned

Satu tugas dikembalikan. Untuk mendapatkan jumlah total tugas yang dikembalikan, gunakan statistik Jumlah. Ground Truth mencoba untuk menyampaikan setiap TasksReturned peristiwa individu satu kali. Jika pengiriman ini tidak berhasil, metrik ini mungkin tidak melaporkan jumlah total tugas yang dikembalikan.

Satuan: Tidak ada

Statistik yang valid: Jumlah, Jumlah Sampel

TasksSubmitted

Satu tugas dikirimkan/diselesaikan oleh pekerja swasta. Untuk mendapatkan jumlah total tugas yang diajukan oleh pekerja, gunakan statistik Jumlah. Ground Truth mencoba untuk menyampaikan setiap TasksSubmitted peristiwa individu satu kali. Jika pengiriman ini tidak berhasil, metrik ini mungkin tidak melaporkan jumlah total tugas yang dikirimkan.

Satuan: Tidak ada

Statistik yang valid: Jumlah, Jumlah Sampel

TimeSpent

Waktu yang dihabiskan untuk tugas yang diselesaikan oleh pekerja swasta. Metrik ini tidak termasuk waktu ketika seorang pekerja berhenti atau beristirahat. Ground Truth mencoba untuk menyampaikan setiap TimeSpent acara satu kali. Jika pengiriman ini tidak berhasil, metrik ini mungkin tidak melaporkan jumlah total waktu yang dihabiskan.

Unit: detik

Statistik yang valid: Jumlah, Jumlah Sampel

TotalDatasetObjectsLabeled

Jumlah objek dataset yang berhasil dilabeli dalam pekerjaan pelabelan. Untuk melihat kemajuan pekerjaan pelabelan, gunakan metrik Max.

Satuan: Tidak ada

Statistik yang valid: Maks

Dimensi untuk Metrik Objek Dataset

Dimensi Deskripsi
LabelingJobName

Memfilter metrik jumlah objek kumpulan data untuk pekerjaan pelabelan.

Metrik Toko SageMaker Fitur Amazon

Metrik Konsumsi Toko Fitur

Metrik Deskripsi
ConsumedReadRequestsUnits

Jumlah unit baca yang dikonsumsi selama periode waktu yang ditentukan. Anda dapat mengambil unit baca yang dikonsumsi untuk operasi runtime feature store dan grup fitur yang sesuai.

Satuan: Tidak ada

Statistik yang valid: Semua

ConsumedWriteRequestsUnits

Jumlah unit tulis yang dikonsumsi selama periode waktu yang ditentukan. Anda dapat mengambil unit tulis yang dikonsumsi untuk operasi runtime feature store dan grup fitur yang sesuai.

Satuan: Tidak ada

Statistik yang valid: Semua

ConsumedReadCapacityUnits

Jumlah unit kapasitas baca yang disediakan yang dikonsumsi selama periode waktu yang ditentukan. Anda dapat mengambil unit kapasitas baca yang dikonsumsi untuk operasi runtime feature store dan grup fitur yang sesuai.

Satuan: Tidak ada

Statistik yang valid: Semua

ConsumedWriteCapacityUnits

Jumlah unit kapasitas tulis yang disediakan yang dikonsumsi selama periode waktu yang ditentukan. Anda dapat mengambil unit kapasitas tulis yang dikonsumsi untuk operasi runtime feature store dan grup fitur yang sesuai.

Satuan: Tidak ada

Statistik yang valid: Semua

Dimensi untuk Metrik Konsumsi Toko Fitur

Dimensi Deskripsi
FeatureGroupName, OperationName

Memfilter metrik konsumsi runtime feature store dari grup fitur dan operasi yang telah Anda tentukan.

Metrik Operasional Toko Fitur

Metrik Deskripsi
Invocations

Jumlah permintaan yang dibuat untuk operasi runtime feature store selama periode waktu yang ditentukan.

Satuan: Tidak ada

Statistik yang valid: Jumlah

Operation4XXErrors

Jumlah permintaan yang dibuat untuk operasi runtime Feature Store di mana operasi mengembalikan kode HTTP respons 4xx. Untuk setiap respons 4xx, 1 dikirim; lain, 0 dikirim.

Satuan: Tidak ada

Statistik yang valid: Rata-rata, Jumlah

Operation5XXErrors

Jumlah permintaan yang dibuat untuk operasi runtime feature store tempat operasi mengembalikan kode HTTP respons 5xx. Untuk setiap respons 5xx, 1 dikirim; lain, 0 dikirim.

Satuan: Tidak ada

Statistik yang valid: Rata-rata, Jumlah

ThrottledRequests

Jumlah permintaan yang dibuat untuk operasi runtime feature store tempat permintaan dibatasi. Untuk setiap permintaan terbatas, 1 dikirim; lain, 0 dikirim.

Satuan: Tidak ada

Statistik yang valid: Rata-rata, Jumlah

Latency

Interval waktu untuk memproses permintaan yang dibuat ke operasi runtime Feature Store. Interval ini diukur dari waktu SageMaker menerima permintaan sampai mengembalikan respons ke klien.

Unit: Mikrodetik

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel, Persentil

Dimensi untuk Metrik Operasional Toko Fitur

Dimensi Deskripsi

FeatureGroupName, OperationName

Memfilter metrik operasional runtime feature store dari grup fitur dan operasi yang telah Anda tentukan. Anda dapat menggunakan dimensi ini untuk operasi non batch, seperti GetRecord, PutRecord, dan DeleteRecord.
OperationName

Memfilter metrik operasional runtime feature store untuk operasi yang telah Anda tentukan. Anda dapat menggunakan dimensi ini untuk operasi batch seperti BatchGetRecord.

SageMaker metrik saluran pipa

AWS/Sagemaker/ModelBuildingPipelineNamespace menyertakan metrik berikut untuk eksekusi pipeline.

Dua kategori metrik eksekusi Pipelines tersedia:

  • Metrik Eksekusi di Semua Pipelines — Metrik eksekusi pipeline level akun (untuk semua pipeline di akun saat ini)

  • Metrik Eksekusi berdasarkan Pipeline — Metrik eksekusi pipa per pipeline

Metrik tersedia pada frekuensi 1 menit.

Metrik Eksekusi Pipelines

Metrik Deskripsi
ExecutionStarted

Jumlah eksekusi pipa yang dimulai.

Unit: Jumlah

Statistik yang valid: Rata-rata, Jumlah

ExecutionFailed

Jumlah eksekusi pipa yang gagal.

Unit: Jumlah

Statistik yang valid: Rata-rata, Jumlah

ExecutionSucceeded

Jumlah eksekusi pipa yang berhasil.

Unit: Jumlah

Statistik yang valid: Rata-rata, Jumlah

ExecutionStopped

Jumlah eksekusi pipa yang berhenti.

Unit: Jumlah

Statistik yang valid: Rata-rata, Jumlah

ExecutionDuration

Durasi dalam milidetik eksekusi pipeline berjalan.

Unit: Milidetik

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel

Dimensi untuk Metrik Eksekusi berdasarkan Pipeline

Dimensi Deskripsi
PipelineName

Memfilter metrik eksekusi pipeline untuk pipeline tertentu.

Metrik Langkah Pipelines

AWS/Sagemaker/ModelBuildingPipelineNamespace menyertakan metrik berikut untuk langkah-langkah pipeline.

Metrik tersedia pada frekuensi 1 menit.

Metrik Deskripsi
StepStarted

Jumlah langkah yang dimulai.

Unit: Jumlah

Statistik yang valid: Rata-rata, Jumlah

StepFailed

Jumlah langkah yang gagal.

Unit: Jumlah

Statistik yang valid: Rata-rata, Jumlah

StepSucceeded

Jumlah langkah yang berhasil.

Unit: Jumlah

Statistik yang valid: Rata-rata, Jumlah

StepStopped

Jumlah langkah yang berhenti.

Unit: Jumlah

Statistik yang valid: Rata-rata, Jumlah

StepDuration

Durasi dalam milidetik langkah berjalan.

Unit: Milidetik

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel

Dimensi untuk Metrik Langkah Pipelines

Dimensi Deskripsi
PipelineName, StepName

Memfilter metrik langkah untuk pipeline dan langkah tertentu.