

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Inferensi sesuai permintaan
<a name="on-demand-inference"></a>

Inferensi sesuai permintaan menyediakan akses tanpa server ke model Amazon Nova tanpa memerlukan kapasitas yang disediakan. Mode ini secara otomatis menskalakan untuk menangani beban kerja dan biaya berdasarkan penggunaan.

## Manfaat
<a name="on-demand-benefits"></a>

Inferensi sesuai permintaan menawarkan beberapa keuntungan:
+ **Tidak ada perencanaan kapasitas:** Secara otomatis skala untuk memenuhi permintaan
+ **Bayar per penggunaan:** Hanya dikenakan biaya untuk token yang diproses
+ **Ketersediaan instan:** Tidak diperlukan waktu penyediaan atau pemanasan
+ **Hemat biaya:** Ideal untuk beban kerja variabel atau tidak terduga

## Menggunakan inferensi sesuai permintaan
<a name="on-demand-usage"></a>

Inferensi sesuai permintaan adalah mode default untuk model Amazon Nova. Cukup tentukan ID model saat melakukan panggilan API:

```
import boto3

bedrock = boto3.client('bedrock-runtime', region_name='us-east-1')

response = bedrock.converse(
    modelId='us.amazon.nova-2-lite-v1:0',
    messages=[
        {
            'role': 'user',
            'content': [{'text': 'Hello, Nova!'}]
        }
    ]
)

# Print the response text
content_list = response["output"]["message"]["content"]
text = next((item["text"] for item in content_list if "text" in item), None)
if text is not None:
    print(text)
```

## Harga
<a name="on-demand-pricing"></a>

Inferensi sesuai permintaan ditagih berdasarkan jumlah token input dan output yang diproses. Untuk detail harga saat ini, lihat [harga Amazon Bedrock](https://aws.amazon.com/bedrock/pricing/).

## Kuota dan batas
<a name="on-demand-limits"></a>

Inferensi sesuai permintaan memiliki kuota default yang bervariasi menurut model dan wilayah. Untuk meminta peningkatan kuota, gunakan konsol [Service Quotas](https://console.aws.amazon.com/servicequotas/).