Permintaan titik akhir untuk data tabular - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Permintaan titik akhir untuk data tabular

Untuk mendapatkan prediksi model untuk analisis bias pasca-pelatihan dan analisis kepentingan fitur, SageMaker Clarify pekerjaan pemrosesan membuat serial data tabular menjadi byte dan mengirimkannya ke titik akhir inferensi sebagai muatan permintaan. Data tabular ini bersumber dari dataset input, atau dihasilkan. Jika itu adalah data sintetis, itu dihasilkan oleh penjelasan untuk SHAP analisis atau PDP analisis.

Format data payload permintaan harus ditentukan oleh content_type parameter konfigurasi analisis. Jika parameter tidak disediakan, pekerjaan pemrosesan SageMaker Clarify akan menggunakan nilai dataset_type parameter sebagai jenis konten. Untuk informasi lebih lanjut tentang content_type ataudataset_type, lihatFile Konfigurasi Analisis.

Bagian berikut menunjukkan contoh permintaan titik akhir dalam format CSV dan JSON Garis.

Pekerjaan pemrosesan SageMaker Clarify dapat membuat serial data ke CSV format (MIMEtype:text/csv). Tabel berikut menunjukkan contoh muatan permintaan serial.

Muatan permintaan titik akhir (representasi string) Komentar

'1,2,3,4'

Rekaman tunggal (empat fitur numerik).

'1,2,3,4\n5,6,7,8'

Dua catatan, dipisahkan oleh jeda baris '\n'.

“Ini adalah produk yang bagus”, 5'

Rekaman tunggal (fitur teks dan fitur numerik).

'"Ini adalah produk yang bagus” ,5\n“Pengalaman belanja yang buruk”, 1 '

Dua catatan.

Pekerjaan pemrosesan SageMaker Clarify dapat membuat serial data ke format padat SageMaker JSON Garis (MIMEtipe:application/jsonlines). Untuk informasi selengkapnya tentang JSON Garis, lihatJSONLINESformat permintaan.

Untuk mengubah data tabular menjadi JSON data, berikan string template ke content_template parameter konfigurasi analisis. Untuk informasi lebih lanjut tentang content_template, lihat File Konfigurasi Analisis. Tabel berikut menunjukkan contoh muatan permintaan JSON Lines serial.

Muatan permintaan titik akhir (representasi string) Komentar

'{"data”: {"features”: [1,2,3,4]}}'

Rekor tunggal. Dalam hal ini, template terlihat seperti '{"data":{"features":$features}}' dan $features digantikan oleh daftar fitur[1,2,3,4].

'{"data”: {"features”: [1,2,3,4]}}\n{"data”: {"features”: [5,6,7,8]}}'

Dua catatan.

'{"features”: ["Ini adalah produk yang bagus” ,5]}'

Rekor tunggal. Dalam hal ini, template terlihat seperti '{"features":$features}' dan $features digantikan oleh daftar fitur["This is a good product",5].

'{"features”: ["Ini adalah produk yang bagus” ,5]}\n{"features”: ["Pengalaman belanja yang buruk” ,1]}'

Dua catatan.

Pekerjaan pemrosesan SageMaker Clarify dapat membuat serial data ke JSON struktur arbitrer (MIMEtipe:application/json). Untuk melakukan ini, Anda harus memberikan string template ke content_template parameter konfigurasi analisis. Ini digunakan oleh pekerjaan pemrosesan SageMaker Clarify untuk membangun JSON struktur luar. Anda juga harus menyediakan string template untukrecord_template, yang digunakan untuk membangun JSON struktur untuk setiap record. Untuk informasi selengkapnya tentang content_template dan record_template, lihat File Konfigurasi Analisis.

catatan

Karena content_template dan record_template merupakan parameter string, setiap karakter kutipan ganda (") yang merupakan bagian dari struktur JSON serial harus dicatat sebagai karakter yang diloloskan dalam konfigurasi Anda. Misalnya, jika Anda ingin menghindari kutipan ganda di Python, Anda bisa memasukkan yang berikut ini untuk. content_template

"{\"data\":{\"features\":$record}}}"

Tabel berikut menunjukkan contoh muatan JSON permintaan serial dan record_template parameter yang sesuai content_template dan yang diperlukan untuk membangunnya.

Muatan permintaan titik akhir (representasi string) Komentar content_template record_template

'{"data”: {"features”: [1,2,3,4]}}'

Rekaman tunggal pada satu waktu.

'{"data”: {"features” :$record}}}'

“$ fitur”

'{"instance”: [[0, 1], [3, 4]], “nama-fitur”: ["A”, “B"]}'

Multi-rekaman dengan nama fitur.

'{"instance” :$records, “feature-names” :$feature_names}'

“$ fitur”

'[{"A”: 0, “B”: 1}, {"A”: 3, “B”: 4}]'

Multi-record dan pasangan kunci-nilai.

“$ catatan”

“$ features_kvp”

'{"A”: 0, “B”: 1}'

Rekaman tunggal pada satu waktu dan pasangan nilai kunci.

“$ rekor”

“$ features_kvp”

'{"A”: 0, “bersarang”: {"B”: 1}}'

Atau, gunakan record_template yang sepenuhnya verbose untuk struktur arbitrer.

“$ rekor”

'{"A”: “$ {A}”, “bersarang”: {"B”: “$ {B}"}}'