Wilayah dan model yang didukung untuk basis pengetahuan Amazon Bedrock - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Wilayah dan model yang didukung untuk basis pengetahuan Amazon Bedrock

Basis pengetahuan Amazon Bedrock didukung di wilayah di seluruh Amerika, Asia, dan Eropa. Model-model tertentu yang disediakan oleh Amazon, Cohere, dan Anthropic didukung untuk basis pengetahuan. Anda menggunakan model untuk mengubah data Anda menjadi embeddings vektor dan model untuk pengambilan informasi dan pembuatan respons.

Anda harus mengaktifkan akses model untuk menggunakan model yang didukung untuk basis pengetahuan.

Jika Anda menggunakan Amazon BedrockAPI, perhatikan model Anda Amazon Resource Name (ARN) yang diperlukan untuk mengonversi data Anda menjadi embeddings vektor dan untuk pengambilan dan pembuatan basis pengetahuan. Salin ID model untuk model yang Anda pilih untuk basis pengetahuan dan buat model ARN menggunakan ID model (sumber daya), mengikuti ARNcontoh yang diberikan untuk jenis sumber daya model Anda.

Jika Anda menggunakan konsol Amazon Bedrock, Anda tidak perlu membuat modelARN, karena Anda dapat memilih model yang tersedia sebagai bagian dari langkah-langkah untuk membuat basis pengetahuan.

Basis pengetahuan Amazon Bedrock didukung di wilayah berikut:

catatan

Amazon Titan Text Premier saat ini hanya tersedia di us-east-1 Wilayah.

Wilayah
AS Timur (Virginia Utara)
AS Barat (Oregon)
Kanada (Pusat)
Asia Pasifik (Mumbai)
Asia Pasifik (Singapura) (akses terjaga keamanannya)
Asia Pasifik (Sydney)
Asia Pasifik (Tokyo)
Eropa (Frankfurt)
Eropa (London)
Eropa (Paris)
Eropa (Irlandia) (akses terjaga keamanannya)
Amerika Selatan (Sao Paulo)
AWS GovCloud (AS-Barat)

Anda dapat menggunakan model berikut untuk mengonversi data Anda menjadi representasi embeddings vektor dari data:

catatan

Anda tidak dapat lagi membuat toko vektor baru dengan Amazon Titan Embeddings G1 - Text. Toko vektor yang dibuat sebelumnya menggunakan Amazon Titan Embeddings G1 - Text masih didukung.

Nama model ID Model
Amazon Titan Embeddings G1 - Text Amazon. titan-embed-text-v1
Embeddings Teks Amazon Titan V2 Amazon. titan-embed-text-v2:0
Cohere Embed (Bahasa Inggris) berdampingan. embed-english-v3
Cohere Embed (Multilingual) berdampingan. embed-multilingual-v3

Anda dapat menggunakan model berikut dengan RetrieveAndGenerateAPIoperasi untuk menghasilkan tanggapan setelah mengambil informasi dari basis pengetahuan:

catatan

RetrieveAndGenerateAPIKueri basis pengetahuan dan menggunakan model basis pengetahuan Amazon Bedrock yang didukung untuk menghasilkan respons dari informasi yang diambilnya. Retrieve API hanya menanyakan basis pengetahuan; itu tidak menghasilkan tanggapan. Oleh karena itu, setelah mengambil hasil dengan RetrieveAPI, Anda dapat menggunakan hasil dalam InvokeModel permintaan dengan Amazon Bedrock atau SageMaker model apa pun untuk menghasilkan respons.

Model ID Model
Amazon Titan Teks Premier Amazon. titan-text-premier-v1:0
Anthropic Claude v2.0 anthropic.claude-v2
Anthropic Claude v2.1 antropik.claude-v 2:1
Anthropic Claude 3 Sonnet v1 anthropic.claude-3-sonnet-20240229-v 1:0
Anthropic Claude 3.5 Soneta anthropic.claude-3-5-sonnet-20240620-v 1:0
Anthropic Claude 3 Haiku v1 anthropic.claude-3-haiku-20240307-v 1:0
Anthropic Claude Instant v1 antropik. claude-instant-v1
Meta Llama 3.1 8B Instruct b-instruct-vmeta.llama3-1-8 1:0
Meta Llama 3.1 70B Instruct b-instruct-vmeta.llama3-1-70 1:0
Meta Llama 3.1 405B Instruct b-instruct-vmeta.llama3-1-405 1:0

Sebuah RetrieveAndGenerateAPIoperasi mendukung jenis throughput berikut:

  • Sesuai permintaan - Mengirim permintaan inferensi model ke wilayah Anda saat ini. Tingkat atau volume permintaan Anda mungkin terbatas selama ledakan pemanfaatan puncak. Pilih throughput sesuai permintaan di konsol atau tentukan ID model di RetrieveAndGeneratepermintaan.

  • Inferensi lintas wilayah — Mendistribusikan permintaan inferensi model di seluruh serangkaian wilayah untuk memungkinkan throughput yang lebih tinggi dan memfasilitasi ketahanan yang lebih besar. Tentukan profil inferensi, yang mendefinisikan titik akhir regional untuk mengirim permintaan pemanggilan model ke, dalam RetrieveAndGenerateatau CreateDataSourcepermintaan. Untuk informasi selengkapnya, lihat Meningkatkan ketahanan dengan inferensi lintas wilayah.

    penting

    Jika Anda menggunakan inferensi lintas wilayah, data Anda dapat dibagikan di seluruh wilayah.