Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Wilayah dan model yang didukung untuk basis pengetahuan Amazon Bedrock
Basis pengetahuan Amazon Bedrock didukung di wilayah di seluruh Amerika, Asia, dan Eropa. Model-model tertentu yang disediakan oleh Amazon, Cohere, dan Anthropic didukung untuk basis pengetahuan. Anda menggunakan model untuk mengubah data Anda menjadi embeddings vektor dan model untuk pengambilan informasi dan pembuatan respons.
Anda harus mengaktifkan akses model untuk menggunakan model yang didukung untuk basis pengetahuan.
Jika Anda menggunakan Amazon BedrockAPI, perhatikan model Anda Amazon Resource Name (ARN) yang diperlukan untuk mengonversi data Anda menjadi embeddings vektor dan untuk pengambilan dan pembuatan basis pengetahuan. Salin ID model untuk model yang Anda pilih untuk basis pengetahuan dan buat model ARN menggunakan ID model (sumber daya), mengikuti ARNcontoh yang diberikan untuk jenis sumber daya model Anda.
Jika Anda menggunakan konsol Amazon Bedrock, Anda tidak perlu membuat modelARN, karena Anda dapat memilih model yang tersedia sebagai bagian dari langkah-langkah untuk membuat basis pengetahuan.
Basis pengetahuan Amazon Bedrock didukung di wilayah berikut:
catatan
Amazon Titan Text Premier saat ini hanya tersedia di us-east-1
Wilayah.
Wilayah |
---|
AS Timur (Virginia Utara) |
AS Barat (Oregon) |
Kanada (Pusat) |
Asia Pasifik (Mumbai) |
Asia Pasifik (Singapura) (akses terjaga keamanannya) |
Asia Pasifik (Sydney) |
Asia Pasifik (Tokyo) |
Eropa (Frankfurt) |
Eropa (London) |
Eropa (Paris) |
Eropa (Irlandia) (akses terjaga keamanannya) |
Amerika Selatan (Sao Paulo) |
AWS GovCloud (AS-Barat) |
Anda dapat menggunakan model berikut untuk mengonversi data Anda menjadi representasi embeddings vektor dari data:
catatan
Anda tidak dapat lagi membuat toko vektor baru dengan Amazon Titan Embeddings G1 - Text. Toko vektor yang dibuat sebelumnya menggunakan Amazon Titan Embeddings G1 - Text masih didukung.
Nama model | ID Model |
---|---|
Amazon Titan Embeddings G1 - Text | Amazon. titan-embed-text-v1 |
Embeddings Teks Amazon Titan V2 | Amazon. titan-embed-text-v2:0 |
Cohere Embed (Bahasa Inggris) | berdampingan. embed-english-v3 |
Cohere Embed (Multilingual) | berdampingan. embed-multilingual-v3 |
Anda dapat menggunakan model berikut dengan RetrieveAndGenerateAPIoperasi untuk menghasilkan tanggapan setelah mengambil informasi dari basis pengetahuan:
catatan
RetrieveAndGenerateAPIKueri basis pengetahuan dan menggunakan model basis pengetahuan Amazon Bedrock yang didukung untuk menghasilkan respons dari informasi yang diambilnya. Retrieve API hanya menanyakan basis pengetahuan; itu tidak menghasilkan tanggapan. Oleh karena itu, setelah mengambil hasil dengan Retrieve
API, Anda dapat menggunakan hasil dalam InvokeModel
permintaan dengan Amazon Bedrock atau SageMaker model apa pun untuk menghasilkan respons.
Model | ID Model |
---|---|
Amazon Titan Teks Premier | Amazon. titan-text-premier-v1:0 |
Anthropic Claude v2.0 | anthropic.claude-v2 |
Anthropic Claude v2.1 | antropik.claude-v 2:1 |
Anthropic Claude 3 Sonnet v1 | anthropic.claude-3-sonnet-20240229-v 1:0 |
Anthropic Claude 3.5 Soneta | anthropic.claude-3-5-sonnet-20240620-v 1:0 |
Anthropic Claude 3 Haiku v1 | anthropic.claude-3-haiku-20240307-v 1:0 |
Anthropic Claude Instant v1 | antropik. claude-instant-v1 |
Meta Llama 3.1 8B Instruct | b-instruct-vmeta.llama3-1-8 1:0 |
Meta Llama 3.1 70B Instruct | b-instruct-vmeta.llama3-1-70 1:0 |
Meta Llama 3.1 405B Instruct | b-instruct-vmeta.llama3-1-405 1:0 |
Sebuah RetrieveAndGenerateAPIoperasi mendukung jenis throughput berikut:
-
Sesuai permintaan - Mengirim permintaan inferensi model ke wilayah Anda saat ini. Tingkat atau volume permintaan Anda mungkin terbatas selama ledakan pemanfaatan puncak. Pilih throughput sesuai permintaan di konsol atau tentukan ID model di RetrieveAndGeneratepermintaan.
-
Inferensi lintas wilayah — Mendistribusikan permintaan inferensi model di seluruh serangkaian wilayah untuk memungkinkan throughput yang lebih tinggi dan memfasilitasi ketahanan yang lebih besar. Tentukan profil inferensi, yang mendefinisikan titik akhir regional untuk mengirim permintaan pemanggilan model ke, dalam RetrieveAndGenerateatau CreateDataSourcepermintaan. Untuk informasi selengkapnya, lihat Meningkatkan ketahanan dengan inferensi lintas wilayah.
penting
Jika Anda menggunakan inferensi lintas wilayah, data Anda dapat dibagikan di seluruh wilayah.