Pantau Amazon SageMaker dengan Amazon CloudWatch - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pantau Amazon SageMaker dengan Amazon CloudWatch

Anda dapat memantau Amazon SageMaker menggunakan Amazon CloudWatch, yang mengumpulkan data mentah dan memprosesnya menjadi metrik yang dapat dibaca, mendekati waktu nyata. Statistik ini disimpan untuk jangka waktu 15 bulan, sehingga Anda dapat mengakses informasi historis dan mendapatkan perspektif yang lebih baik tentang performa aplikasi atau layanan web Anda. Namun, CloudWatch konsol Amazon membatasi pencarian ke metrik yang diperbarui dalam 2 minggu terakhir. Batasan ini memastikan bahwa pekerjaan terbaru ditampilkan di namespace Anda. Untuk membuat grafik metrik tanpa menggunakan pencarian, tentukan nama persisnya di tampilan sumber. Anda juga dapat mengatur alarm yang memperhatikan ambang batas tertentu dan mengirim notifikasi atau mengambil tindakan saat ambang batas tersebut terpenuhi. Untuk informasi selengkapnya, lihat Panduan CloudWatch Pengguna Amazon.

SageMaker Metrik Pemanggilan Titik Akhir

AWS/SageMakerNamespace menyertakan metrik permintaan berikut dari panggilan ke. InvokeEndpoint

Metrik tersedia pada frekuensi 1 menit.

Ilustrasi berikut menunjukkan bagaimana SageMaker endpoint berinteraksi dengan Amazon SageMaker Runtime API. Waktu keseluruhan antara mengirim permintaan ke titik akhir dan menerima respons tergantung pada tiga komponen berikut.

  • Latensi jaringan — waktu yang diperlukan antara membuat permintaan ke SageMaker Runtime Runtime API dan menerima respons kembali dari SageMaker Runtime Runtime API.

  • Latensi overhead — waktu yang diperlukan untuk mengangkut permintaan ke container model dari SageMaker Runtime Runtime API dan mengangkut respons kembali ke Runtime Runtime API. SageMaker

  • Latensi model — waktu yang dibutuhkan wadah model untuk memproses permintaan dan mengembalikan respons.

Ilustrasi yang menunjukkan bahwa latensi total adalah jumlah latensi jaringan, overhead, dan model.

Untuk informasi selengkapnya tentang latensi total, lihat Praktik terbaik untuk pengujian beban titik akhir inferensi SageMaker real-time Amazon. Untuk informasi tentang berapa lama CloudWatch metrik dipertahankan, lihat GetMetricStatisticsdi Referensi Amazon CloudWatch API.

Metrik Pemanggilan Titik Akhir

Metrik Deskripsi
Invocation4XXErrors

Jumlah InvokeEndpoint permintaan di mana model mengembalikan kode respons HTTP 4xx. Untuk setiap respons 4xx, 1 dikirim; jika tidak, 0 dikirim.

Satuan: Tidak ada

Statistik yang valid: Rata-rata, Jumlah

Invocation5XXErrors

Jumlah InvokeEndpoint permintaan di mana model mengembalikan kode respons HTTP 5xx. Untuk setiap respons 5xx, 1 dikirim; jika tidak, 0 dikirim.

Satuan: Tidak ada

Statistik yang valid: Rata-rata, Jumlah

InvocationModelErrors

Jumlah permintaan pemanggilan model yang tidak menghasilkan respons HTTP 2XX. Ini termasuk kode status 4XX/5XX, kesalahan soket tingkat rendah, respons HTTP yang salah bentuk, dan batas waktu permintaan. Untuk setiap respons kesalahan, 1 dikirim; jika tidak, 0 dikirim.

Satuan: Tidak ada

Statistik yang valid: Rata-rata, Jumlah

Invocations

Jumlah InvokeEndpoint permintaan yang dikirim ke titik akhir model.

Untuk mendapatkan jumlah total permintaan yang dikirim ke titik akhir model, gunakan statistik Jumlah.

Satuan: Tidak ada

Statistik yang valid: Jumlah

InvocationsPerCopy

Jumlah pemanggilan dinormalisasi oleh setiap salinan komponen inferensi.

Statistik yang valid: Jumlah

InvocationsPerInstance

Jumlah pemanggilan yang dikirim ke model, dinormalisasi oleh InstanceCount masing-masing ProductionVariant. 1/ numberOfInstances dikirim sebagai nilai pada setiap permintaan, di mana numberOfInstances adalah jumlah instance aktif untuk ProductionVariant di belakang titik akhir pada saat permintaan.

Satuan: Tidak ada

Statistik yang valid: Jumlah

ModelLatency

Interval waktu yang dibutuhkan oleh model untuk menanggapi permintaan SageMaker Runtime API. Interval ini mencakup waktu komunikasi lokal yang diambil untuk mengirim permintaan dan untuk mengambil respons dari wadah model dan waktu yang dibutuhkan untuk menyelesaikan inferensi dalam wadah.

Unit: Mikrodetik

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel

ModelSetupTime

Waktu yang dibutuhkan untuk meluncurkan sumber daya komputasi baru untuk titik akhir tanpa server. Waktu dapat bervariasi tergantung pada ukuran model, berapa lama waktu yang dibutuhkan untuk mengunduh model, dan waktu start-up wadah.

Unit: Mikrodetik

Statistik yang valid: Rata-rata, Min, Maks, Jumlah Sampel, Persentil

OverheadLatency

Interval waktu ditambahkan ke waktu yang dibutuhkan untuk menanggapi permintaan klien dengan biaya SageMaker overhead. Interval ini diukur dari waktu SageMaker menerima permintaan sampai mengembalikan respons ke klien, dikurangiModelLatency. Latensi overhead dapat bervariasi tergantung pada beberapa faktor, termasuk ukuran payload permintaan dan respons, frekuensi permintaan, dan otentikasi/otorisasi permintaan.

Unit: Mikrodetik

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel

Dimensi untuk Metrik Pemanggilan Titik Akhir

Dimensi Deskripsi
EndpointName, VariantName

Memfilter metrik pemanggilan titik akhir untuk titik akhir dan ProductionVariant varian yang ditentukan.

InferenceComponentName

Filter metrik pemanggilan komponen inferensi.

SageMaker Metrik Komponen Inferensi

/aws/sagemaker/InferenceComponentsNamespace menyertakan metrik berikut dari panggilan ke titik akhir yang InvokeEndpointmenghosting komponen inferensi.

Metrik tersedia pada frekuensi 1 menit.

Metrik Deskripsi
CPUUtilizationNormalized

Nilai CPUUtilizationNormalized metrik yang dilaporkan oleh setiap salinan komponen inferensi. Nilai berkisar antara 0% — 100%. Jika Anda menyetel NumberOfCpuCoresRequired parameter dalam pengaturan untuk salinan komponen inferensi, metrik menyajikan pemanfaatan selama reservasi. Jika tidak, metrik menyajikan pemanfaatan di atas batas.

GPUMemoryUtilizationNormalized

Nilai GPUMemoryUtilizationNormalized metrik yang dilaporkan oleh setiap salinan komponen inferensi.

GPUUtilizationNormalized

Nilai GPUUtilizationNormalized metrik yang dilaporkan oleh setiap salinan komponen inferensi. Jika Anda menyetel NumberOfAcceleratorDevicesRequired parameter dalam pengaturan untuk salinan komponen inferensi, metrik menyajikan pemanfaatan selama reservasi. Jika tidak, metrik menyajikan pemanfaatan di atas batas.

MemoryUtilizationNormalized

Nilai yang MemoryUtilizationNormalized dilaporkan oleh setiap salinan komponen inferensi. Jika Anda menyetel MinMemoryRequiredInMb parameter dalam pengaturan untuk salinan komponen inferensi, metrik menyajikan pemanfaatan selama reservasi. Jika tidak, metrik menyajikan pemanfaatan di atas batas.

Dimensi untuk Metrik Komponen Inferensi

Dimensi Deskripsi
InferenceComponentName

Filter metrik komponen inferensi.

SageMaker Metrik Titik Akhir Multi-Model

AWS/SageMakerNamespace menyertakan metrik pemuatan model berikut dari panggilan ke. InvokeEndpoint

Metrik tersedia pada frekuensi 1 menit.

Untuk informasi tentang berapa lama CloudWatch metrik dipertahankan, lihat GetMetricStatisticsdi Referensi Amazon CloudWatch API.

Metrik Pemuatan Model Titik Akhir Multi-Model

Metrik Deskripsi
ModelLoadingWaitTime

Interval waktu permintaan pemanggilan telah menunggu model target diunduh, atau dimuat, atau keduanya untuk melakukan inferensi.

Unit: Mikrodetik

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel

ModelUnloadingTime

Interval waktu yang diperlukan untuk membongkar model melalui panggilan UnloadModel API container.

Unit: Mikrodetik

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel

ModelDownloadingTime

Interval waktu yang dibutuhkan untuk mengunduh model dari Amazon Simple Storage Service (Amazon S3).

Unit: Mikrodetik

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel

ModelLoadingTime

Interval waktu yang diperlukan untuk memuat model melalui panggilan LoadModel API container.

Unit: Mikrodetik

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel

ModelCacheHit

Jumlah InvokeEndpoint permintaan yang dikirim ke titik akhir multi-model yang modelnya sudah dimuat.

Statistik rata-rata menunjukkan rasio permintaan yang modelnya sudah dimuat.

Satuan: Tidak ada

Statistik yang valid: Rata-rata, Jumlah, Jumlah Sampel

Dimensi untuk Metrik Pemuatan Model Titik Akhir Multi-Model

Dimensi Deskripsi
EndpointName, VariantName

Memfilter metrik pemanggilan titik akhir untuk titik akhir dan ProductionVariant varian yang ditentukan.

/aws/sagemaker/EndpointsRuang nama menyertakan metrik instance berikut dari panggilan ke. InvokeEndpoint

Metrik tersedia pada frekuensi 1 menit.

Untuk informasi tentang berapa lama CloudWatch metrik dipertahankan, lihat GetMetricStatisticsdi Referensi Amazon CloudWatch API.

Metrik Instans Model Titik Akhir Multi-Model

Metrik Deskripsi
LoadedModelCount

Jumlah model yang dimuat dalam wadah titik akhir multi-model. Metrik ini dipancarkan per instance.

Statistik rata-rata dengan periode 1 menit memberi tahu Anda jumlah rata-rata model yang dimuat per instance.

Statistik Jumlah memberi tahu Anda jumlah total model yang dimuat di semua instance di titik akhir.

Model yang dilacak metrik ini belum tentu unik karena model mungkin dimuat dalam beberapa wadah di titik akhir.

Satuan: Tidak ada

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel

Dimensi untuk Metrik Pemuatan Model Titik Akhir Multi-Model

Dimensi Deskripsi
EndpointName, VariantName

Memfilter metrik pemanggilan titik akhir untuk titik akhir dan ProductionVariant varian yang ditentukan.

SageMaker Lowongan Kerja dan Metrik Titik Akhir

/aws/sagemaker/EndpointsRuang nama /aws/sagemaker/ProcessingJobs/aws/sagemaker/TrainingJobs,/aws/sagemaker/TransformJobs,, dan menyertakan metrik berikut untuk pekerjaan pelatihan dan instance titik akhir.

Metrik tersedia pada frekuensi 1 menit.

catatan

Amazon CloudWatch mendukung metrik kustom resolusi tinggi dan resolusi terbaiknya adalah 1 detik. Namun, semakin halus resolusinya, semakin pendek umur metrik. CloudWatch Untuk resolusi frekuensi 1 detik, CloudWatch metrik tersedia selama 3 jam. Untuk informasi selengkapnya tentang resolusi dan umur CloudWatch metrik, lihat GetMetricStatisticsdi Referensi Amazon CloudWatch API.

Tip

Jika Anda ingin membuat profil pekerjaan pelatihan Anda dengan resolusi yang lebih baik hingga perincian 100 milidetik (0,1 detik) dan menyimpan metrik pelatihan tanpa batas waktu di Amazon S3 untuk analisis khusus kapan saja, pertimbangkan untuk menggunakan Amazon Debugger. SageMaker SageMaker Debugger menyediakan aturan bawaan untuk secara otomatis mendeteksi masalah pelatihan umum; ia mendeteksi masalah pemanfaatan sumber daya perangkat keras (seperti kemacetan CPU, GPU, dan I/O) dan masalah model non-konvergen (seperti overfit, gradien menghilang, dan tensor yang meledak). SageMaker Debugger juga menyediakan visualisasi melalui Studio Classic dan laporan profilingnya. Untuk menjelajahi visualisasi Debugger, lihat Panduan Dasbor Wawasan SageMaker Debugger, Panduan Laporan Profil Debugger, dan Menganalisis Data Menggunakan Pustaka Klien SMDebug.

Processing Job, Training Job, Batch Transform Job, dan Endpoint Instance Metrics

Metrik Deskripsi
CPUReservation

Jumlah CPU yang dicadangkan oleh kontainer pada sebuah instance. Nilai berkisar antara 0% — 100%. Dalam pengaturan untuk komponen inferensi, Anda mengatur reservasi CPU dengan NumberOfCpuCoresRequired parameter. Misalnya, jika ada 4 CPU, dan 2 dicadangkan, CPUReservation metriknya adalah 50%.

CPUUtilization Jumlah dari setiap pemanfaatan inti CPU individu. Pemanfaatan CPU dari setiap rentang inti adalah 0-100. Misalnya, jika ada empat CPU, CPUUtilization kisarannya adalah 0% - 400%. Untuk pekerjaan pemrosesan, nilainya adalah pemanfaatan CPU dari wadah pemrosesan pada instance.

Untuk pekerjaan pelatihan, nilainya adalah pemanfaatan CPU dari wadah algoritma pada instance.

Untuk pekerjaan transformasi batch, nilainya adalah pemanfaatan CPU dari wadah transformasi pada instance.

Untuk varian endpoint, nilainya adalah jumlah dari pemanfaatan CPU dari wadah primer dan tambahan pada instance.

catatan

Untuk pekerjaan multi-instance, setiap instans melaporkan metrik pemanfaatan CPU. Namun, tampilan default CloudWatch menunjukkan pemanfaatan CPU rata-rata di semua instance.

Unit: Persen

CPUUtilizationNormalized

Jumlah normalisasi pemanfaatan masing-masing inti CPU individu. Nilai berkisar antara 0% — 100%. Misalnya, jika ada empat CPU, dan metriknya 200%, maka CPUUtilization CPUUtilizationNormalized metriknya adalah 50%.

DiskUtilization

Persentase ruang disk yang digunakan oleh kontainer pada sebuah instance menggunakan. Kisaran nilai ini adalah 0% - 100%. Metrik ini tidak didukung untuk pekerjaan transformasi batch.

Untuk pekerjaan pemrosesan, nilainya adalah pemanfaatan ruang disk dari wadah pemrosesan pada instance.

Untuk pekerjaan pelatihan, nilainya adalah pemanfaatan ruang disk dari wadah algoritma pada instance.

Untuk varian endpoint, nilainya adalah jumlah dari pemanfaatan ruang disk dari wadah primer dan tambahan pada instance.

Unit: Persen

catatan

Untuk pekerjaan multi-instance, setiap instance melaporkan metrik pemanfaatan disk. Namun, tampilan default CloudWatch menunjukkan pemanfaatan disk rata-rata di semua instance.

GPUMemoryUtilization

Persentase memori GPU yang digunakan oleh kontainer pada sebuah instance. Kisaran nilai adalah 0-100 dan dikalikan dengan jumlah GPU. Misalnya, jika ada empat GPU, GPUMemoryUtilization kisarannya adalah 0% - 400%.

Untuk pekerjaan pemrosesan, nilainya adalah pemanfaatan memori GPU dari wadah pemrosesan pada instance.

Untuk pekerjaan pelatihan, nilainya adalah pemanfaatan memori GPU dari wadah algoritma pada instance.

Untuk pekerjaan transformasi batch, nilainya adalah pemanfaatan memori GPU dari wadah transformasi pada instance.

Untuk varian titik akhir, nilainya adalah jumlah dari pemanfaatan memori GPU dari wadah primer dan tambahan pada instance.

catatan

Untuk pekerjaan multi-instance, setiap instance melaporkan metrik pemanfaatan memori GPU. Namun, tampilan default CloudWatch menunjukkan pemanfaatan memori GPU rata-rata di semua instance.

Unit: Persen

GPUMemoryUtilizationNormalized

Persentase memori GPU yang dinormalisasi yang digunakan oleh kontainer pada sebuah instance. Nilai berkisar antara 0% — 100%. Misalnya, jika ada empat GPU, dan metriknya 200%, maka GPUMemoryUtilization GPUMemoryUtilizationNormalized metriknya adalah 50%.

GPUReservation

Jumlah GPU yang dicadangkan oleh kontainer pada sebuah instance. Nilai berkisar antara 0% — 100%. Dalam pengaturan untuk komponen inferensi, Anda mengatur reservasi GPU dengan. NumberOfAcceleratorDevicesRequired Misalnya, jika ada 4 GPU dan 2 dicadangkan, GPUReservation metriknya adalah 50%.

GPUUtilization

Persentase unit GPU yang digunakan oleh kontainer pada sebuah instance. Nilai dapat berkisar antara 0-100 dan dikalikan dengan jumlah GPU. Misalnya, jika ada empat GPU, GPUUtilization kisarannya adalah 0% - 400%.

Untuk pekerjaan pemrosesan, nilainya adalah pemanfaatan GPU dari wadah pemrosesan pada instance.

Untuk pekerjaan pelatihan, nilainya adalah pemanfaatan GPU dari wadah algoritma pada instance.

Untuk pekerjaan transformasi batch, nilainya adalah pemanfaatan GPU dari wadah transformasi pada instance.

Untuk varian endpoint, nilainya adalah jumlah dari pemanfaatan GPU dari wadah primer dan tambahan pada instance.

catatan

Untuk pekerjaan multi-instance, setiap instans melaporkan metrik pemanfaatan GPU. Namun, tampilan default CloudWatch menunjukkan pemanfaatan GPU rata-rata di semua instance.

Unit: Persen

GPUUtilizationNormalized

Persentase unit GPU yang dinormalisasi yang digunakan oleh kontainer pada sebuah instance. Nilai berkisar antara 0% — 100%. Misalnya, jika ada empat GPU, dan metriknya 200%, maka GPUUtilization GPUUtilizationNormalized metriknya adalah 50%.

MemoryReservation

Jumlah memori yang dicadangkan oleh kontainer pada sebuah instance. Nilai berkisar antara 0% — 100%. Dalam pengaturan untuk komponen inferensi, Anda mengatur reservasi memori dengan MinMemoryRequiredInMb parameter. Misalnya, jika instance 32 GiB mencadangkan 1024 MB, MemoryReservation metriknya adalah 29,8%.

MemoryUtilization

Persentase memori yang digunakan oleh kontainer pada sebuah instance. Kisaran nilai ini adalah 0% - 100%.

Untuk pekerjaan pemrosesan, nilainya adalah pemanfaatan memori dari wadah pemrosesan pada instance.

Untuk pekerjaan pelatihan, nilainya adalah pemanfaatan memori dari wadah algoritma pada instance.

Untuk pekerjaan transformasi batch, nilainya adalah pemanfaatan memori dari wadah transformasi pada instance.

Untuk varian titik akhir, nilainya adalah jumlah dari pemanfaatan memori wadah primer dan tambahan pada instance.

Unit: Persen

catatan

Untuk pekerjaan multi-instance, setiap instance melaporkan metrik pemanfaatan memori. Namun, tampilan default CloudWatch menunjukkan pemanfaatan memori rata-rata di semua instance.

Dimensi untuk Metrik Processing Job, Training Job, dan Batch Transform Job Instance

Dimensi Deskripsi
Host

Untuk memproses pekerjaan, nilai untuk dimensi ini memiliki format[processing-job-name]/algo-[instance-number-in-cluster]. Gunakan dimensi ini untuk memfilter metrik instance untuk pekerjaan pemrosesan dan instance yang ditentukan. Format dimensi ini hanya ada di /aws/sagemaker/ProcessingJobs namespace.

Untuk pekerjaan pelatihan, nilai untuk dimensi ini memiliki format[training-job-name]/algo-[instance-number-in-cluster]. Gunakan dimensi ini untuk memfilter metrik instance untuk pekerjaan dan instance pelatihan yang ditentukan. Format dimensi ini hanya ada di /aws/sagemaker/TrainingJobs namespace.

Untuk pekerjaan transformasi batch, nilai untuk dimensi ini memiliki format[transform-job-name]/[instance-id]. Gunakan dimensi ini untuk memfilter metrik instance untuk pekerjaan dan instance transformasi batch yang ditentukan. Format dimensi ini hanya ada di /aws/sagemaker/TransformJobs namespace.

SageMaker Metrik Lowongan Inference Recommender

/aws/sagemaker/InferenceRecommendationsJobsNamespace menyertakan metrik berikut untuk pekerjaan rekomendasi inferensi.

Metrik Rekomendasi Inferensi

Metrik Deskripsi
ClientInvocations

Jumlah InvokeEndpoint permintaan yang dikirim ke titik akhir model, seperti yang diamati oleh Inference Recommender.

Satuan: Tidak ada

Statistik yang valid: Jumlah

ClientInvocationErrors

Jumlah InvokeEndpoint permintaan yang gagal, seperti yang diamati oleh Inference Recommender.

Satuan: Tidak ada

Statistik yang valid: Jumlah

ClientLatency

Interval waktu yang dibutuhkan antara mengirim InvokeEndpoint panggilan dan menerima respons seperti yang diamati oleh Inference Recommender. Perhatikan bahwa waktunya dalam milidetik, sedangkan metrik pemanggilan ModelLatency titik akhir dalam mikrodetik.

Unit: Milidetik

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel, Persentil

NumberOfUsers

Jumlah pengguna bersamaan yang mengirim InvokeEndpoint permintaan ke titik akhir model.

Satuan: Tidak ada

Statistik yang valid: Maks, Min, Rata-rata

Dimensi untuk Metrik Pekerjaan Inference Recommender

Dimensi Deskripsi
JobName

Filter metrik pekerjaan Inference Recommender untuk pekerjaan Inference Recommender yang ditentukan.

EndpointName

Filter metrik pekerjaan Inference Recommender untuk titik akhir yang ditentukan.

SageMaker Metrik Ground Truth

Metrik Ground Truth

Metrik Deskripsi
ActiveWorkers

Seorang pekerja aktif tunggal di tim kerja pribadi mengajukan, melepaskan, atau menolak tugas. Untuk mendapatkan jumlah total pekerja aktif, gunakan statistik Jumlah. Ground Truth mencoba untuk menyampaikan setiap ActiveWorkers peristiwa individu satu kali. Jika pengiriman ini tidak berhasil, metrik ini mungkin tidak melaporkan jumlah total pekerja aktif

Satuan: Tidak ada

Statistik yang valid: Jumlah, Jumlah Sampel

DatasetObjectsAutoAnnotated

Jumlah objek kumpulan data yang dianotasi secara otomatis dalam pekerjaan pelabelan. Metrik ini hanya dipancarkan saat pelabelan otomatis diaktifkan. Untuk melihat kemajuan pekerjaan pelabelan, gunakan metrik Max.

Satuan: Tidak ada

Statistik yang valid: Maks

DatasetObjectsHumanAnnotated

Jumlah objek dataset yang dianotasi oleh manusia dalam pekerjaan pelabelan. Untuk melihat kemajuan pekerjaan pelabelan, gunakan metrik Max.

Satuan: Tidak ada

Statistik yang valid: Maks

DatasetObjectsLabelingFailed

Jumlah objek dataset yang gagal diberi label dalam pekerjaan pelabelan. Untuk melihat kemajuan pekerjaan pelabelan, gunakan metrik Max.

Satuan: Tidak ada

Statistik yang valid: Maks

JobsFailed

Satu pekerjaan pelabelan gagal. Untuk mendapatkan jumlah total pekerjaan pelabelan yang gagal, gunakan statistik Jumlah.

Satuan: Tidak ada

Statistik yang valid: Jumlah, Jumlah Sampel

JobsSucceeded

Pekerjaan pelabelan tunggal berhasil. Untuk mendapatkan jumlah total pekerjaan pelabelan yang berhasil, gunakan statistik Sum.

Satuan: Tidak ada

Statistik yang valid: Jumlah, Jumlah Sampel

JobsStopped

Satu pekerjaan pelabelan dihentikan. Untuk mendapatkan jumlah total pekerjaan pelabelan yang dihentikan, gunakan statistik Jumlah.

Satuan: Tidak ada

Statistik yang valid: Jumlah, Jumlah Sampel

TasksAccepted

Satu tugas diterima oleh seorang pekerja. Untuk mendapatkan jumlah total tugas yang diterima oleh pekerja, gunakan statistik Jumlah. Ground Truth mencoba untuk menyampaikan setiap TaskAccepted peristiwa individu satu kali. Jika pengiriman ini tidak berhasil, metrik ini mungkin tidak melaporkan jumlah total tugas yang diterima.

Satuan: Tidak ada

Statistik yang valid: Jumlah, Jumlah Sampel

TasksDeclined

Satu tugas ditolak oleh seorang pekerja. Untuk mendapatkan jumlah total tugas yang ditolak oleh pekerja, gunakan statistik Jumlah. Ground Truth mencoba untuk menyampaikan setiap TasksDeclined peristiwa individu satu kali. Jika pengiriman ini tidak berhasil, metrik ini mungkin tidak melaporkan jumlah total tugas yang ditolak.

Satuan: Tidak ada

Statistik yang Valid: Jumlah, Jumlah Sampel

TasksReturned

Satu tugas dikembalikan. Untuk mendapatkan jumlah total tugas yang dikembalikan, gunakan statistik Jumlah. Ground Truth mencoba untuk menyampaikan setiap TasksReturned peristiwa individu satu kali. Jika pengiriman ini tidak berhasil, metrik ini mungkin tidak melaporkan jumlah total tugas yang dikembalikan.

Satuan: Tidak ada

Statistik yang valid: Jumlah, Jumlah Sampel

TasksSubmitted

Satu tugas dikirimkan/diselesaikan oleh pekerja swasta. Untuk mendapatkan jumlah total tugas yang diajukan oleh pekerja, gunakan statistik Jumlah. Ground Truth mencoba untuk menyampaikan setiap TasksSubmitted peristiwa individu satu kali. Jika pengiriman ini tidak berhasil, metrik ini mungkin tidak melaporkan jumlah total tugas yang dikirimkan.

Satuan: Tidak ada

Statistik yang valid: Jumlah, Jumlah Sampel

TimeSpent

Waktu yang dihabiskan untuk tugas yang diselesaikan oleh pekerja swasta. Metrik ini tidak termasuk waktu ketika seorang pekerja berhenti atau beristirahat. Ground Truth mencoba untuk menyampaikan setiap TimeSpent acara satu kali. Jika pengiriman ini tidak berhasil, metrik ini mungkin tidak melaporkan jumlah total waktu yang dihabiskan.

Unit: detik

Statistik yang valid: Jumlah, Jumlah Sampel

TotalDatasetObjectsLabeled

Jumlah objek dataset yang berhasil dilabeli dalam pekerjaan pelabelan. Untuk melihat kemajuan pekerjaan pelabelan, gunakan metrik Max.

Satuan: Tidak ada

Statistik yang valid: Maks

Dimensi untuk Metrik Objek Dataset

Dimensi Deskripsi
LabelingJobName

Memfilter metrik jumlah objek kumpulan data untuk pekerjaan pelabelan.

Metrik Toko SageMaker Fitur Amazon

Metrik Konsumsi Toko Fitur

Metrik Deskripsi
ConsumedReadRequestsUnits

Jumlah unit baca yang dikonsumsi selama periode waktu yang ditentukan. Anda dapat mengambil unit baca yang dikonsumsi untuk operasi runtime feature store dan grup fitur yang sesuai.

Satuan: Tidak ada

Statistik yang valid: Semua

ConsumedWriteRequestsUnits

Jumlah unit tulis yang dikonsumsi selama periode waktu yang ditentukan. Anda dapat mengambil unit tulis yang dikonsumsi untuk operasi runtime feature store dan grup fitur yang sesuai.

Satuan: Tidak ada

Statistik yang valid: Semua

ConsumedReadCapacityUnits

Jumlah unit kapasitas baca yang disediakan yang dikonsumsi selama periode waktu yang ditentukan. Anda dapat mengambil unit kapasitas baca yang dikonsumsi untuk operasi runtime feature store dan grup fitur yang sesuai.

Satuan: Tidak ada

Statistik yang valid: Semua

ConsumedWriteCapacityUnits

Jumlah unit kapasitas tulis yang disediakan yang dikonsumsi selama periode waktu yang ditentukan. Anda dapat mengambil unit kapasitas tulis yang dikonsumsi untuk operasi runtime feature store dan grup fitur yang sesuai.

Satuan: Tidak ada

Statistik yang valid: Semua

Dimensi untuk Metrik Konsumsi Toko Fitur

Dimensi Deskripsi
FeatureGroupName, OperationName

Memfilter metrik konsumsi runtime feature store dari grup fitur dan operasi yang telah Anda tentukan.

Metrik Operasional Toko Fitur

Metrik Deskripsi
Invocations

Jumlah permintaan yang dibuat untuk operasi runtime feature store selama periode waktu yang ditentukan.

Satuan: Tidak ada

Statistik yang valid: Jumlah

Operation4XXErrors

Jumlah permintaan yang dibuat untuk operasi runtime Feature Store di mana operasi mengembalikan kode respons HTTP 4xx. Untuk setiap respons 4xx, 1 dikirim; jika tidak, 0 dikirim.

Satuan: Tidak ada

Statistik yang valid: Rata-rata, Jumlah

Operation5XXErrors

Jumlah permintaan yang dibuat untuk operasi runtime feature store dimana operasi mengembalikan kode respons HTTP 5xx. Untuk setiap respons 5xx, 1 dikirim; jika tidak, 0 dikirim.

Satuan: Tidak ada

Statistik yang valid: Rata-rata, Jumlah

ThrottledRequests

Jumlah permintaan yang dibuat untuk operasi runtime feature store tempat permintaan dibatasi. Untuk setiap permintaan yang dibatasi, 1 dikirim; jika tidak, 0 dikirim.

Satuan: Tidak ada

Statistik yang valid: Rata-rata, Jumlah

Latency

Interval waktu untuk memproses permintaan yang dibuat ke operasi runtime Feature Store. Interval ini diukur dari waktu SageMaker menerima permintaan hingga mengembalikan respons ke klien.

Unit: Mikrodetik

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel, Persentil

Dimensi untuk Metrik Operasional Toko Fitur

Dimensi Deskripsi

FeatureGroupName, OperationName

Memfilter metrik operasional runtime feature store dari grup fitur dan operasi yang telah Anda tentukan. Anda dapat menggunakan dimensi ini untuk operasi non batch, seperti GetRecord, PutRecord, dan DeleteRecord.
OperationName

Memfilter metrik operasional runtime feature store untuk operasi yang telah Anda tentukan. Anda dapat menggunakan dimensi ini untuk operasi batch seperti BatchGetRecord.

SageMaker Metrik Pipelines

AWS/Sagemaker/ModelBuildingPipelineNamespace menyertakan metrik berikut untuk eksekusi pipeline.

Dua kategori metrik eksekusi Pipelines tersedia:

  • Metrik Eksekusi di Semua Pipelines — Metrik eksekusi pipeline level akun (untuk semua pipeline di akun saat ini)

  • Metrik Eksekusi berdasarkan Pipeline - Metrik eksekusi pipa per pipeline

Metrik tersedia pada frekuensi 1 menit.

Metrik Eksekusi Pipelines

Metrik Deskripsi
ExecutionStarted

Jumlah eksekusi pipa yang dimulai.

Unit: Hitungan

Statistik yang valid: Rata-rata, Jumlah

ExecutionFailed

Jumlah eksekusi pipa yang gagal.

Unit: Hitungan

Statistik yang valid: Rata-rata, Jumlah

ExecutionSucceeded

Jumlah eksekusi pipa yang berhasil.

Unit: Hitungan

Statistik yang valid: Rata-rata, Jumlah

ExecutionStopped

Jumlah eksekusi pipa yang berhenti.

Unit: Hitungan

Statistik yang valid: Rata-rata, Jumlah

ExecutionDuration

Durasi dalam milidetik eksekusi pipeline berjalan.

Unit: Milidetik

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel

Dimensi untuk Metrik Eksekusi berdasarkan Pipeline

Dimensi Deskripsi
PipelineName

Memfilter metrik eksekusi pipeline untuk pipeline tertentu.

Metrik Langkah Pipelines

AWS/Sagemaker/ModelBuildingPipelineNamespace menyertakan metrik berikut untuk langkah-langkah pipeline.

Metrik tersedia pada frekuensi 1 menit.

Metrik Deskripsi
StepStarted

Jumlah langkah yang dimulai.

Unit: Hitungan

Statistik yang valid: Rata-rata, Jumlah

StepFailed

Jumlah langkah yang gagal.

Unit: Hitungan

Statistik yang valid: Rata-rata, Jumlah

StepSucceeded

Jumlah langkah yang berhasil.

Unit: Hitungan

Statistik yang valid: Rata-rata, Jumlah

StepStopped

Jumlah langkah yang berhenti.

Unit: Hitungan

Statistik yang valid: Rata-rata, Jumlah

StepDuration

Durasi dalam milidetik langkah berjalan.

Unit: Milidetik

Statistik yang valid: Rata-rata, Jumlah, Min, Maks, Jumlah Sampel

Dimensi untuk Metrik Langkah Pipelines

Dimensi Deskripsi
PipelineName, StepName

Memfilter metrik langkah untuk pipeline dan langkah tertentu.