Format dan unggah data inferensi batch Anda

Mode fokus

Format dan unggah data inferensi batch Anda - Amazon Bedrock

Contoh masukan teks untuk Anthropic Claude 3 Haiku Contoh masukan video untuk Amazon Nova

Anda harus menambahkan data inferensi batch ke lokasi S3 yang akan Anda pilih atau tentukan saat mengirimkan pekerjaan pemanggilan model. Lokasi S3 harus berisi item berikut:

Setidaknya satu file JSONL yang mendefinisikan input model. Sebuah JSONL berisi baris objek JSON. File JSONL Anda harus diakhiri dengan ekstensi.jsonl dan dalam format berikut:
```
{ "recordId" : "11 character alphanumeric string", "modelInput" : {JSON body} }
...
```
Setiap baris berisi objek JSON dengan recordId bidang dan modelInput bidang yang berisi badan permintaan untuk input yang ingin Anda kirimkan. Format objek modelInput JSON harus cocok dengan body bidang untuk model yang Anda gunakan dalam InvokeModel permintaan. Untuk informasi selengkapnya, lihat Parameter permintaan inferensi dan bidang respons untuk model pondasi.
catatan
- Jika Anda menghilangkan recordId bidang, Amazon Bedrock menambahkannya di output.
- Anda menentukan model yang ingin Anda gunakan saat membuat pekerjaan inferensi batch.
(Jika Anda mendefinisikan konten input sebagai lokasi Amazon S3) Beberapa model memungkinkan Anda untuk menentukan konten input sebagai lokasi S3. Jika Anda memilih opsi ini, pastikan bahwa lokasi S3 yang akan Anda tentukan berisi konten dan file JSONL Anda. Konten dan file JSONL Anda dapat bersarang di folder di lokasi S3 yang Anda tentukan. Sebagai contoh, lihat Contoh masukan video untuk Amazon Nova.

Pastikan input Anda sesuai dengan kuota inferensi batch. Anda dapat mencari kuota berikut di kuota layanan Amazon Bedrock:

Jumlah minimum catatan per pekerjaan inferensi batch - Jumlah minimum catatan (objek JSON) di seluruh file JSONL dalam pekerjaan.
Rekaman per file input per pekerjaan inferensi batch - Jumlah maksimum catatan (objek JSON) dalam satu file JSONL dalam pekerjaan.
Rekaman per pekerjaan inferensi batch — Jumlah maksimum catatan (objek JSON) di seluruh file JSONL dalam pekerjaan.
Ukuran file input inferensi Batch — Ukuran maksimum satu file dalam pekerjaan.
Ukuran pekerjaan inferensi Batch — Ukuran kumulatif maksimum dari semua file input.

Untuk lebih memahami cara mengatur input inferensi batch Anda, lihat contoh berikut:

Contoh masukan teks untuk Anthropic Claude 3 Haiku

Jika Anda berencana untuk menjalankan inferensi batch menggunakan format Messages API untuk Anthropic Claude 3 Haiku model, Anda mungkin menyediakan file JSONL yang berisi objek JSON berikut sebagai salah satu baris:


{
    "recordId": "CALL0000001", 
    "modelInput": {
        "anthropic_version": "bedrock-2023-05-31", 
        "max_tokens": 1024,
        "messages": [ 
            { 
                "role": "user", 
                "content": [
                    {
                        "type": "text", 
                        "text": "Summarize the following call transcript: ..." 
                    } 
                ]
            }
        ]
    }
}

Contoh masukan video untuk Amazon Nova

Jika Anda berencana untuk menjalankan inferensi batch pada input video menggunakan Amazon Nova Lite atau Amazon Nova Pro model, Anda memiliki opsi untuk mendefinisikan video dalam byte atau sebagai lokasi S3 di file JSONL. Misalnya, Anda mungkin memiliki bucket S3 yang jalurnya s3://batch-inference-input-bucket dan berisi file-file berikut:


videos/
    video1.mp4
    video2.mp4
    ...
    video50.mp4
input.jsonl

Contoh catatan dari input.jsonl file tersebut adalah sebagai berikut:


{
    "recordId": "RECORD01",
    "modelInput": {
        "messages": [
            {
                "role": "user",
                "content": [
                    {
                        "text": "You are an expert in recipe videos. Describe this video in less than 200 words following these guidelines: ..."
                    },
                    {
                        "video": {
                            "format": "mp4",
                            "source": {
                                "s3Location": {
                                    "uri": "s3://batch-inference-input-bucket/videos/video1.mp4",
                                    "bucketOwner": "111122223333"
                                }
                            }
                        }
                    }
                ]
            }
        ]
    }
}

Saat Anda membuat pekerjaan inferensi batch, Anda dapat menentukan s3://batch-inference-input-bucket sebagai lokasi S3. Inferensi Batch akan memproses input.jsonl file di lokasi, selain file video di dalam videos folder yang direferensikan dalam file JSONL.

Sumber daya berikut memberikan informasi lebih lanjut tentang mengirimkan input video untuk inferensi batch:

Untuk mempelajari cara memvalidasi Amazon URIs S3 secara proaktif dalam permintaan input, lihat blog Parsing URL Amazon S3.
Untuk informasi lebih lanjut tentang cara mengatur catatan doa untuk pemahaman video dengan Nova, lihat Amazon Nova pedoman yang mendorong visi.

Topik berikut menjelaskan cara mengatur akses S3 dan izin inferensi batch untuk identitas agar dapat melakukan inferensi batch.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Prasyarat

Izin

Di halaman ini

Pilih preferensi cookie Anda

Sesuaikan preferensi cookie

Penting

Kinerja

Fungsional

Iklan

Tidak dapat menyimpan preferensi cookie

Format dan unggah data inferensi batch Anda

catatan

Contoh masukan teks untuk Anthropic Claude 3 Haiku

Contoh masukan video untuk Amazon Nova

Di halaman ini

Related resources

Apakah halaman ini membantu Anda?

Related resources

Topik berikutnya:

Topik sebelumnya:

Perlu bantuan?