Format Data untuk Inferensi Object2Vec

Mode fokus

Format Data untuk Inferensi Object2Vec - Amazon SageMaker AI

Optimasi GPU: Klasifikasi atau Regresi Masukan: Format Permintaan Klasifikasi atau Regresi Keluaran: Klasifikasi atau Format Respons Regresi

Halaman berikut menjelaskan permintaan input dan format respons output untuk mendapatkan inferensi penilaian dari model Amazon SageMaker AI Object2Vec.

Optimasi GPU: Klasifikasi atau Regresi

Karena kelangkaan memori GPU, variabel INFERENCE_PREFERRED_MODE lingkungan dapat ditentukan untuk mengoptimalkan apakah klasifikasi/regresi atau jaringan inferensi dimuat ke dalam Keluaran: Embeddings Encoder GPU. Jika sebagian besar inferensi Anda adalah untuk klasifikasi atau regresi, tentukan. INFERENCE_PREFERRED_MODE=classification Berikut ini adalah contoh Transformasi Batch menggunakan 4 instance p3.2xlarge yang mengoptimalkan untuk inferensi klasifikasi/regresi:


transformer = o2v.transformer(instance_count=4,
                              instance_type="ml.p2.xlarge",
                              max_concurrent_transforms=2,
                              max_payload=1,  # 1MB
                              strategy='MultiRecord',
                              env={'INFERENCE_PREFERRED_MODE': 'classification'},  # only useful with GPU
                              output_path=output_s3_path)

Masukan: Format Permintaan Klasifikasi atau Regresi

Tipe konten: aplikasi/json


{
  "instances" : [
    {"in0": [6, 17, 606, 19, 53, 67, 52, 12, 5, 10, 15, 10178, 7, 33, 652, 80, 15, 69, 821, 4], "in1": [16, 21, 13, 45, 14, 9, 80, 59, 164, 4]},
    {"in0": [22, 1016, 32, 13, 25, 11, 5, 64, 573, 45, 5, 80, 15, 67, 21, 7, 9, 107, 4], "in1": [22, 32, 13, 25, 1016, 573, 3252, 4]},
    {"in0": [774, 14, 21, 206], "in1": [21, 366, 125]}
  ]
}

Tipe konten: aplikasi/jsonlines


{"in0": [6, 17, 606, 19, 53, 67, 52, 12, 5, 10, 15, 10178, 7, 33, 652, 80, 15, 69, 821, 4], "in1": [16, 21, 13, 45, 14, 9, 80, 59, 164, 4]}
{"in0": [22, 1016, 32, 13, 25, 11, 5, 64, 573, 45, 5, 80, 15, 67, 21, 7, 9, 107, 4], "in1": [22, 32, 13, 25, 1016, 573, 3252, 4]}
{"in0": [774, 14, 21, 206], "in1": [21, 366, 125]}

Untuk masalah klasifikasi, panjang vektor skor sesuai dengannum_classes. Untuk masalah regresi, panjangnya adalah 1.

Keluaran: Klasifikasi atau Format Respons Regresi

Terima: aplikasi/json


{
    "predictions": [
        {
            "scores": [
                0.6533935070037842,
                0.07582679390907288,
                0.2707797586917877
            ]
        },
        {
            "scores": [
                0.026291321963071823,
                0.6577019095420837,
                0.31600672006607056
            ]
        }
    ]
}

Terima: aplikasi/jsonlines


{"scores":[0.195667684078216,0.395351558923721,0.408980727195739]}
{"scores":[0.251988261938095,0.258233487606048,0.489778339862823]}
{"scores":[0.280087798833847,0.368331134319305,0.351581096649169]}

Dalam format klasifikasi dan regresi, skor berlaku untuk masing-masing label.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Format Pelatihan

Format Inferensi: Embeddings

Di halaman ini

Pilih preferensi cookie Anda

Sesuaikan preferensi cookie

Penting

Kinerja

Fungsional

Iklan

Tidak dapat menyimpan preferensi cookie

Format Data untuk Inferensi Object2Vec

Optimasi GPU: Klasifikasi atau Regresi

Masukan: Format Permintaan Klasifikasi atau Regresi

Keluaran: Klasifikasi atau Format Respons Regresi

Di halaman ini

Related resources

Apakah halaman ini membantu Anda?

Related resources

Topik berikutnya:

Topik sebelumnya:

Perlu bantuan?