Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menyebarkan cetak biru vektorisasi data streaming
Topik ini menjelaskan cara menerapkan cetak biru vektorisasi data streaming.
Menyebarkan cetak biru vektorisasi data streaming
-
Pastikan sumber daya berikut diatur dengan benar:
-
Cluster MSK yang disediakan atau Tanpa Server dengan satu atau lebih topik yang berisi data.
-
-
Pengaturan Batuan Dasar: Akses ke Model Batuan Dasar yang diinginkan. Model Bedrock yang saat ini didukung adalah:
Amazon Titan Embeddings G1 - Teks
Embeddings Teks Amazon Titan V2
Embeddings Multimodal Amazon Titan G1
Cohere Sematkan Bahasa Inggris
Cohere Sematkan Multilingual
-
AWS OpenSearch koleksi:
Anda dapat menggunakan koleksi Layanan yang disediakan atau Tanpa Server OpenSearch .
Koleksi OpenSearch Layanan harus memiliki setidaknya satu indeks.
Jika Anda berencana untuk menggunakan koleksi OpenSearch Tanpa Server, pastikan untuk membuat koleksi pencarian vektor. Untuk detail tentang cara menyiapkan indeks vektor, lihat Prasyarat untuk penyimpanan vektor Anda sendiri untuk basis pengetahuan. Untuk mempelajari lebih lanjut tentang vektorisasi, lihat kemampuan database vektor Amazon OpenSearch Service
dijelaskan. catatan
Saat membuat indeks vektor, Anda harus menggunakan nama bidang vektor
embedded_data
.Jika Anda berencana untuk menggunakan koleksi OpenSearch Provisioned, Anda perlu menambahkan peran aplikasi MSF (yang berisi kebijakan akses Opensearch) yang dibuat oleh cetak biru, sebagai pengguna utama ke koleksi Anda. OpenSearch Juga, konfirmasikan bahwa kebijakan akses OpenSearch diatur ke tindakan “Izinkan”. Ini diperlukan untuk mengaktifkan kontrol akses butir halus.
Secara opsional, Anda dapat mengaktifkan akses ke OpenSearch dasbor untuk melihat hasil. Lihat untuk mengaktifkan kontrol akses butir halus.
Login menggunakan peran yang memungkinkan CreateStack izin aws:.
Buka dasbor konsol MSF dan pilih Buat Aplikasi Streaming.
Dalam Pilih metode untuk mengatur aplikasi pemrosesan aliran pilih Gunakan Blueprint.
Pilih cetak biru aplikasi AI real-time dari menu tarik-turun cetak biru.
Berikan konfigurasi yang diinginkan. Lihat Buat konfigurasi halaman.
Pilih Deploy Blueprint untuk memulai penerapan. CloudFormation
Setelah CloudFormation penerapan selesai, buka aplikasi Flink yang digunakan. Periksa properti Runtime aplikasi.
Anda dapat memilih untuk mengubah/menambahkan properti runtime ke aplikasi Anda. Lihat Konfigurasi Properti Runtime untuk detail untuk mengonfigurasi properti ini.
catatan
Catatan:
Jika Anda menggunakan OpenSearch provisioned, pastikan Anda mengaktifkan kontrol akses butir halus.
Jika klaster yang disediakan bersifat pribadi, tambahkan URL endpoint VPC OpenSearch Provisioned Anda dan
sink.os.endpoint
ubahhttps://
ke titik akhir ini.Jika klaster yang Anda berikan bersifat publik, pastikan aplikasi MSF Anda dapat mengakses internet. Untuk informasi selengkapnya, lihat >>>>>> express-brokers-publication-merge type="documentation” url="managed- flink/latest/java/vpc -internet.html ">Akses internet dan layanan untuk aplikasi Managed Service yang terhubung dengan VPC untuk Apache Flink.
Setelah Anda puas dengan semua konfigurasi, pilih
Run
. Aplikasi akan mulai berjalan.Pompa pesan di cluster MSK Anda.
Arahkan ke cluster Opensearch dan pergi ke OpenSearch dasbor.
Di dasbor, pilih Temukan di menu sebelah kiri. Anda akan melihat dokumen yang bertahan bersama dengan penyematan vektornya.
Lihat Bekerja dengan koleksi pencarian vektor untuk melihat bagaimana Anda dapat menggunakan vektor yang disimpan dalam indeks.
Buat konfigurasi halaman
Topik ini menjelaskan membuat konfigurasi halaman untuk dirujuk saat menentukan konfigurasi untuk cetak biru aplikasi AI waktu nyata.
- Nama aplikasi
-
Bidang yang ada di MSF, berikan nama apa pun untuk aplikasi Anda.
- Kluster MSK
-
Pilih cluster MSK yang Anda buat selama penyiapan dari daftar dropdown.
- Topik
-
Tambahkan nama topik yang Anda buat dalam pengaturan.
- Jenis data aliran masukan
-
Pilih String jika Anda akan menyediakan input string ke aliran MSK.
Pilih JSON jika input dalam aliran MSK adalah JSON. Dalam kunci JSON tertanam, tulis nama bidang di JSON masukan Anda yang nilainya ingin Anda kirim ke Bedrock untuk menghasilkan embeddings.
- Model penyematan batuan dasar
Pilih salah satu dari daftar. Pastikan Anda memiliki akses model untuk model yang Anda pilih, jika tidak tumpukan mungkin gagal. Lihat Menambahkan atau menghapus akses ke model foundation Amazon Bedrock.
- OpenSearch klaster
Pilih cluster yang Anda buat dari dropdown.
- OpenSearch nama indeks vektor
Pilih indeks vektor yang Anda buat pada langkah di atas.