Menafsirkan hasil - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menafsirkan hasil

Setelah Anda menjalankan pekerjaan pemrosesan dasar dan memperoleh statistik dan kendala untuk kumpulan data Anda, Anda dapat menjalankan tugas pemantauan yang menghitung statistik dan mencantumkan setiap pelanggaran yang dihadapi relatif terhadap batasan dasar. CloudWatch Metrik Amazon juga dilaporkan di akun Anda secara default. Untuk informasi tentang melihat hasil pemantauan di Amazon SageMaker Studio, lihatVisualisasikan hasil untuk titik akhir real-time di Amazon Studio SageMaker .

Daftar Eksekusi

Jadwal mulai memantau pekerjaan pada interval yang ditentukan. Kode berikut mencantumkan lima eksekusi terbaru. Jika Anda menjalankan kode ini setelah membuat jadwal per jam, eksekusi mungkin kosong, dan Anda mungkin harus menunggu sampai Anda melewati batas jam (inUTC) untuk melihat eksekusi dimulai. Kode berikut mencakup logika untuk menunggu.

mon_executions = my_default_monitor.list_executions() print("We created a hourly schedule above and it will kick off executions ON the hour (plus 0 - 20 min buffer.\nWe will have to wait till we hit the hour...") while len(mon_executions) == 0: print("Waiting for the 1st execution to happen...") time.sleep(60) mon_executions = my_default_monitor.list_executions()

Memeriksa Eksekusi Tertentu

Pada langkah sebelumnya, Anda mengambil eksekusi terjadwal terbaru yang selesai atau gagal. Anda dapat menjelajahi apa yang benar atau salah. Status terminal adalah:

  • Completed— Eksekusi pemantauan selesai dan tidak ada masalah yang ditemukan dalam laporan pelanggaran.

  • CompletedWithViolations— Eksekusi selesai, tetapi pelanggaran kendala terdeteksi.

  • Failed— Eksekusi pemantauan gagal, mungkin karena kesalahan klien (misalnya, masalah peran) atau masalah infrastruktur. Untuk mengidentifikasi penyebabnya, lihat FailureReason danExitMessage.

latest_execution = mon_executions[-1] # latest execution's index is -1, previous is -2 and so on.. time.sleep(60) latest_execution.wait(logs=False) print("Latest execution status: {}".format(latest_execution.describe()['ProcessingJobStatus'])) print("Latest execution result: {}".format(latest_execution.describe()['ExitMessage'])) latest_job = latest_execution.describe() if (latest_job['ProcessingJobStatus'] != 'Completed'): print("====STOP==== \n No completed executions to inspect further. Please wait till an execution completes or investigate previously reported failures.")
report_uri=latest_execution.output.destination print('Report Uri: {}'.format(report_uri))

Daftar Laporan yang Dihasilkan

Gunakan kode berikut untuk membuat daftar laporan yang dihasilkan.

from urllib.parse import urlparse s3uri = urlparse(report_uri) report_bucket = s3uri.netloc report_key = s3uri.path.lstrip('/') print('Report bucket: {}'.format(report_bucket)) print('Report key: {}'.format(report_key)) s3_client = boto3.Session().client('s3') result = s3_client.list_objects(Bucket=report_bucket, Prefix=report_key) report_files = [report_file.get("Key") for report_file in result.get('Contents')] print("Found Report Files:") print("\n ".join(report_files))

Laporan Pelanggaran

Jika ada pelanggaran dibandingkan dengan baseline, mereka dihasilkan dalam laporan pelanggaran. Gunakan kode berikut untuk membuat daftar pelanggaran.

violations = my_default_monitor.latest_monitoring_constraint_violations() pd.set_option('display.max_colwidth', -1) constraints_df = pd.io.json.json_normalize(violations.body_dict["violations"]) constraints_df.head(10)

Ini hanya berlaku untuk kumpulan data yang berisi data tabular. File skema berikut menentukan statistik yang dihitung dan pelanggaran yang dipantau.

File Output untuk Dataset Tabular

Nama berkas Deskripsi
statistics.json

Berisi statistik kolumnar untuk setiap fitur dalam kumpulan data yang dianalisis. Lihat skema file ini di topik berikutnya.

catatan

File ini dibuat hanya untuk pemantauan kualitas data.

constraint_violations.json

Berisi daftar pelanggaran yang ditemukan dalam kumpulan data saat ini dibandingkan dengan statistik dasar dan file kendala yang ditentukan dalam dan jalur. baseline_constaints baseline_statistics

Amazon SageMaker Model Monitor wadah bawaanIni menyimpan satu set CloudWatch metrik Amazon untuk setiap fitur secara default.

Kode kontainer dapat memancarkan CloudWatch metrik di lokasi ini:. /opt/ml/output/metrics/cloudwatch