Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Halaman berikut menjelaskan permintaan inferensi dan format respons untuk MXNet model Deteksi Objek Amazon SageMaker AI.
Format Permintaan
Kueri model terlatih dengan menggunakan titik akhir model. Titik akhir mengambil format gambar.jpg dan .png dengan dan tipe konten. image/jpeg
image/png
Format Respons
Responsnya adalah indeks kelas dengan skor kepercayaan dan koordinat kotak pembatas untuk semua objek dalam gambar yang dikodekan dalam format JSON. Berikut ini adalah contoh dari respon file.json:
{"prediction":[
[4.0, 0.86419455409049988, 0.3088374733924866, 0.07030484080314636, 0.7110607028007507, 0.9345266819000244],
[0.0, 0.73376623392105103, 0.5714187026023865, 0.40427327156066895, 0.827075183391571, 0.9712159633636475],
[4.0, 0.32643985450267792, 0.3677481412887573, 0.034883320331573486, 0.6318609714508057, 0.5967587828636169],
[8.0, 0.22552496790885925, 0.6152569651603699, 0.5722782611846924, 0.882301390171051, 0.8985623121261597],
[3.0, 0.42260299175977707, 0.019305512309074402, 0.08386176824569702, 0.39093565940856934, 0.9574796557426453]
]}
Setiap baris dalam file.json ini berisi array yang mewakili objek yang terdeteksi. Masing-masing array objek ini terdiri dari daftar enam angka. Angka pertama adalah label kelas yang diprediksi. Angka kedua adalah skor kepercayaan terkait untuk deteksi. Empat angka terakhir mewakili koordinat kotak pembatas [xmin, ymin, xmax, ymax]. Indeks sudut kotak pembatas keluaran ini dinormalisasi oleh ukuran gambar keseluruhan. Perhatikan bahwa pengkodean ini berbeda dari yang digunakan oleh format input .json. Misalnya, pada entri pertama hasil deteksi, 0,3088374733924866 adalah koordinat kiri (koordinat x sudut kiri atas) dari kotak pembatas sebagai rasio lebar gambar keseluruhan, 0,07030484080314636 adalah koordinat atas (koordinat y dari sudut kiri atas) dari kotak pembatas sebagai rasio tinggi gambar keseluruhan, 0,711070606028007507 adalah koordinat kanan (koordinat x sudut kanan bawah) dari kotak pembatas sebagai rasio lebar gambar keseluruhan, dan 0,9345266819000244 adalah koordinat bawah (koordinat y dari sudut kanan bawah) dari bounding box sebagai rasio tinggi gambar keseluruhan.
Untuk menghindari hasil deteksi yang tidak dapat diandalkan, Anda mungkin ingin menyaring hasil deteksi dengan skor kepercayaan rendah. Dalam buku catatan sampel deteksi objek
Untuk transformasi batch, responsnya dalam format JSON, di mana formatnya identik dengan format JSON yang dijelaskan di atas. Hasil deteksi setiap gambar direpresentasikan sebagai file JSON. Sebagai contoh:
{"prediction": [[label_id, confidence_score, xmin, ymin, xmax, ymax], [label_id, confidence_score, xmin, ymin, xmax, ymax]]}
Untuk detail lebih lanjut tentang pelatihan dan inferensi, lihat. Notebook Contoh Deteksi Objek
KELUARAN: Format Respons JSON
terima: aplikasi/json; anotasi = 1
{
"image_size": [
{
"width": 500,
"height": 400,
"depth": 3
}
],
"annotations": [
{
"class_id": 0,
"score": 0.943,
"left": 111,
"top": 134,
"width": 61,
"height": 128
},
{
"class_id": 0,
"score": 0.0013,
"left": 161,
"top": 250,
"width": 79,
"height": 143
},
{
"class_id": 1,
"score": 0.0133,
"left": 101,
"top": 185,
"width": 42,
"height": 130
}
]
}