AI21 LabsJurassic-2model - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

AI21 LabsJurassic-2model

Bagian ini memberikan parameter inferensi dan contoh kode untuk menggunakan AI21 Labs AI21 Labs Jurassic-2 model.

Parameter inferensi

AI21 LabsJurassic-2Model mendukung parameter inferensi berikut.

Keacakan dan Keanekaragaman

AI21 LabsJurassic-2Model mendukung parameter berikut untuk mengontrol keacakan dan keragaman dalam respons.

  • Temperatur (temperature) — Gunakan nilai yang lebih rendah untuk mengurangi keacakan dalam respons.

  • Top P (topP) — Gunakan nilai yang lebih rendah untuk mengabaikan opsi yang kurang mungkin.

Panjang

AI21 LabsJurassic-2Model mendukung parameter berikut untuk mengontrol panjang respons yang dihasilkan.

  • Panjang penyelesaian maksimum (maxTokens) - Tentukan jumlah maksimum token yang akan digunakan dalam respons yang dihasilkan.

  • Stop sequences (stopSequences) — Konfigurasikan urutan berhenti yang dikenali model dan setelah itu berhenti menghasilkan token lebih lanjut. Tekan tombol Enter untuk menyisipkan karakter baris baru dalam urutan berhenti. Gunakan tombol Tab untuk menyelesaikan penyisipan urutan berhenti.

Pengulangan

AI21 LabsJurassic-2Model mendukung parameter berikut untuk mengontrol pengulangan dalam respons yang dihasilkan.

  • Penalti kehadiran (presencePenalty) — Gunakan nilai yang lebih tinggi untuk menurunkan probabilitas menghasilkan token baru yang sudah muncul setidaknya sekali dalam prompt atau dalam penyelesaian.

  • Hitung penalti (countPenalty) — Gunakan nilai yang lebih tinggi untuk menurunkan probabilitas menghasilkan token baru yang sudah muncul setidaknya sekali dalam prompt atau penyelesaian. Sebanding dengan jumlah penampilan.

  • Penalti frekuensi (frequencyPenalty) — Gunakan nilai tinggi untuk menurunkan probabilitas menghasilkan token baru yang sudah muncul setidaknya sekali dalam prompt atau dalam penyelesaian. Nilai sebanding dengan frekuensi tampilan token (dinormalisasi ke panjang teks).

  • Menghukum token khusus — Kurangi kemungkinan pengulangan karakter khusus. Nilai default adalahtrue.

    • Whitespaces (applyToWhitespaces) — true Nilai menerapkan penalti ke spasi putih dan baris baru.

    • Tanda baca (applyToPunctuation) — true Nilai menerapkan penalti untuk tanda baca.

    • Numbers (applyToNumbers) — true Nilai menerapkan penalti ke angka.

    • Stop words (applyToStopwords) — true Nilai menerapkan penalti untuk menghentikan kata-kata.

    • Emojis (applyToEmojis) — true Nilai tidak termasuk emoji dari penalti.

Bidang badan permintaan permintaan model

Saat Anda membuat InvokeModelatau InvokeModelWithResponseStreammemanggil menggunakan AI21 Labs model, isi body bidang dengan objek JSON yang sesuai dengan yang di bawah ini. Masukkan prompt di prompt bidang.

{ "prompt": string, "temperature": float, "topP": float, "maxTokens": int, "stopSequences": [string], "countPenalty": { "scale": float }, "presencePenalty": { "scale": float }, "frequencyPenalty": { "scale": float } }

Untuk menghukum token khusus, tambahkan bidang tersebut ke salah satu objek penalti. Misalnya, Anda dapat memodifikasi countPenalty bidang sebagai berikut.

"countPenalty": { "scale": float, "applyToWhitespaces": boolean, "applyToPunctuations": boolean, "applyToNumbers": boolean, "applyToStopwords": boolean, "applyToEmojis": boolean }

Tabel berikut menunjukkan nilai minimum, maksimum, dan default untuk parameter numerik.

Kategori Parameter Format objek JSON Minimum Maksimum Default
Keacakan dan keragaman Temperatur suhu 0 1 0,5
P Teratas TopP 0 1 0,5
Panjang Token maks (model menengah, ultra, dan besar) MaxTokens 0 8,191 200
Token maks (model lain) 0 2,048 200
Pengulangan Hukuman kehadiran Kehadiran Hukuman 0 5 0
Hitung penalti Hitung Penalti 0 1 0
Penalti frekuensi Frekuensi Penalti 0 500 0

Bidang tubuh respons pemanggilan model

Untuk informasi tentang format body bidang dalam tanggapan, lihat https://docs.ai21.com/reference/j2-complete-ref.

catatan

Amazon Bedrock mengembalikan identifier respon (id) sebagai nilai integer.

Contoh kode

Contoh ini menunjukkan cara memanggil model A2I AI21 Labs Jurassic-2 Mid.

import boto3 import json brt = boto3.client(service_name='bedrock-runtime') body = json.dumps({ "prompt": "Translate to spanish: 'Amazon Bedrock is the easiest way to build and scale generative AI applications with base models (FMs)'.", "maxTokens": 200, "temperature": 0.5, "topP": 0.5 }) modelId = 'ai21.j2-mid-v1' accept = 'application/json' contentType = 'application/json' response = brt.invoke_model( body=body, modelId=modelId, accept=accept, contentType=contentType ) response_body = json.loads(response.get('body').read()) # text print(response_body.get('completions')[0].get('data').get('text'))