Prerequisiti per il tuo archivio vettoriale per una knowledge base - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Prerequisiti per il tuo archivio vettoriale per una knowledge base

Un archivio vettoriale contiene la rappresentazione degli incorporamenti vettoriali dei tuoi dati. Il testo viene convertito in incorporamenti vettoriali e scritto in un indice vettoriale, mantenendo al contempo una mappatura rispetto al documento originale. Gli incorporamenti vettoriali consentono di confrontare matematicamente i testi.

Se preferisci che Amazon Bedrock crei automaticamente un indice vettoriale in Amazon OpenSearch Serverless per te, salta questo prerequisito e procedi con. Crea una knowledge base Amazon Bedrock

Puoi configurare il tuo archivio vettoriale supportato per indicizzare la rappresentazione degli incorporamenti vettoriali dei tuoi dati. Crei campi per i seguenti dati:

  • Un campo per i vettori generati dal testo nella fonte di dati dal modello di incorporamento scelto.

  • Un campo per i blocchi di testo estratti dai file nella fonte di dati.

  • Campi per i metadati dei file di origine gestiti da Amazon Bedrock.

  • (Se utilizzi un database Amazon Aurora e desideri configurare il filtro sui metadati) Campi per i metadati che associ ai tuoi file sorgente. Se prevedi di configurare il filtro in altri archivi vettoriali, non devi configurare questi campi per il filtraggio.

Puoi crittografare gli archivi vettoriali di terze parti con una chiave. KMS Per ulteriori informazioni, vedere Crittografia delle risorse della knowledge base.

Seleziona la scheda corrispondente al servizio di archivio vettoriale che utilizzerai per creare il tuo indice vettoriale.

Amazon OpenSearch Serverless
  1. Per configurare le autorizzazioni e creare una raccolta di ricerche vettoriali in Amazon OpenSearch Serverless nel AWS Management Console, segui i passaggi 1 e 2 in Lavorare con le raccolte di ricerca vettoriale nella Amazon OpenSearch Service Developer Guide. Tieni presente le seguenti considerazioni durante la configurazione della raccolta:

    1. Assegna alla collezione un nome e una descrizione a tua scelta.

    2. Per rendere privata la tua raccolta, seleziona Creazione standard nella sezione Sicurezza. Quindi, nella sezione Impostazioni di accesso alla rete, seleziona VPCcome tipo di accesso e scegli un VPC endpoint. Per ulteriori informazioni sulla configurazione di un VPC endpoint per una raccolta Amazon OpenSearch Serverless, consulta Accedere ad Amazon OpenSearch Serverless utilizzando un endpoint di interfaccia (AWS PrivateLink) nella Amazon OpenSearch Service Developer Guide.

  2. Una volta creata la raccolta, prendi nota della raccolta ARN per quando crei la knowledge base.

  3. Nel riquadro di navigazione a sinistra, seleziona Raccolte in Serverless. Quindi seleziona la tua raccolta di ricerca vettoriale.

  4. Seleziona la scheda Indici. Quindi scegli Crea indice vettoriale.

  5. Nella sezione Dettagli dell'indice vettoriale, inserisci un nome per l'indice nel campo Nome dell'indice vettoriale.

  6. Nella sezione Campi vettoriali, scegli Aggiungi campo vettoriale. Amazon Bedrock memorizza gli incorporamenti vettoriali per la tua origine dati in questo campo. Fornisci le seguenti configurazioni:

    • Nome campo vettoriale: fornisci un nome per il campo (ad esempio,embeddings).

    • Motore: il motore vettoriale utilizzato per la ricerca. Seleziona faiss.

    • Dimensioni: il numero di dimensioni nel vettore. Fate riferimento alla tabella seguente per determinare quante dimensioni deve contenere il vettore:

      Modello Dimensioni
      Titan Incorporamenti G1 - Testo 1.536
      Titan Incorporamenti V2 - Testo 1,024
      Cohere Embed Italiano 1,024
      Cohere Embed Multilingue 1,024
    • Metrica di distanza: la metrica utilizzata per misurare la similarità tra i vettori. Si consiglia di utilizzare Euclidean.

  7. Espandi la sezione Gestione dei metadati e aggiungi due campi per configurare l'indice vettoriale per archiviare metadati aggiuntivi che una knowledge base può recuperare con i vettori. La tabella seguente descrive i campi e i valori da specificare per ogni campo:

    Descrizione del campo Campo di mappatura Tipo di dati Filtrabile
    Amazon Bedrock suddivide il testo non elaborato dai tuoi dati e li archivia in questo campo. Nome a tua scelta (ad esempio,) text Stringa True
    Amazon Bedrock archivia i metadati relativi alla tua knowledge base in questo campo. Nome a tua scelta (ad esempio,) bedrock-metadata Stringa False
  8. Prendi nota dei nomi che scegli per il nome dell'indice vettoriale, il nome del campo vettoriale e i nomi dei campi di mappatura per la gestione dei metadati per la creazione della knowledge base. Quindi, scegli Crea.

Dopo aver creato l'indice vettoriale, puoi procedere con la creazione della tua knowledge base. La tabella seguente riassume dove inserirete ogni informazione di cui avete preso nota.

Campo Campo corrispondente nella configurazione della knowledge base (Console) Campo corrispondente nella configurazione della knowledge base () API Descrizione
Collezione ARN Collezione ARN collezione ARN L'Amazon Resource Name (ARN) della raccolta di ricerca vettoriale.
Nome dell'indice vettoriale Nome dell'indice vettoriale vectorIndexName Il nome dell'indice vettoriale.
Nome del campo vettoriale Campo vettoriale vectorField Il nome del campo in cui archiviare gli incorporamenti vettoriali per le fonti di dati.
Gestione dei metadati (primo campo di mappatura) Campo di testo textField Il nome del campo in cui memorizzare il testo non elaborato proveniente dalle fonti di dati.
Gestione dei metadati (secondo campo di mappatura) Campo di metadati gestito da Bedrock metadataField Il nome del campo in cui archiviare i metadati gestiti da Amazon Bedrock.

Per una documentazione più dettagliata sulla configurazione di un archivio vettoriale in Amazon OpenSearch Serverless, consulta Working with vector search collections nella Amazon OpenSearch Service Developer Guide.

Amazon Aurora (RDS)
  1. Crea un cluster, uno schema e una tabella di database Amazon Aurora (DB) seguendo i passaggi descritti in Usare Aurora SQL Postgre come knowledge base. Quando crei la tabella, configurala con le seguenti colonne e tipi di dati. Puoi utilizzare i nomi delle colonne che preferisci anziché quelli elencati nella tabella seguente. Prendi nota dei nomi delle colonne che scegli in modo da poterli fornire durante la configurazione della knowledge base.

    Nome colonna Tipo di dati Campo corrispondente nella configurazione della knowledge base (Console) Campo corrispondente nella configurazione della knowledge base () API Descrizione
    id UUIDchiave primaria Chiave primaria primaryKeyField Contiene identificatori univoci per ogni record.
    incorporamento Vettore Campo vettoriale vectorField Contiene gli incorporamenti vettoriali delle origini dati.
    pezzi Testo Campo di testo textField Contiene i blocchi di testo non elaborato provenienti dalle origini dati.
    metadata JSON campo di metadati gestito da Bedrock metadataField Contiene i metadati necessari per eseguire l'attribuzione dell'origine e per consentire l'importazione dei dati e l'interrogazione
  2. (Facoltativo) Se hai aggiunto metadati ai file per filtrarli, devi anche creare una colonna per ogni attributo di metadati nei file e specificare il tipo di dati (testo, numero o booleano). Ad esempio, se l'attributo genre esiste nell'origine dati, è necessario aggiungere una colonna denominata genre e specificare text come tipo di dati. Durante l'inserimento dei dati, queste colonne verranno popolate con i valori degli attributi corrispondenti.

  3. Configurare un AWS Secrets Manager segreto per il tuo cluster Aurora DB seguendo i passaggi di Gestione delle password con Amazon Aurora e AWS Secrets Manager.

  4. Prendi nota delle seguenti informazioni dopo aver creato il cluster di database e impostato il segreto.

    Campo corrispondente nella configurazione della knowledge base (Console) Campo nella configurazione della knowledge base () API Descrizione
    Cluster Amazon Aurora DB ARN resourceArn Il ARN tuo cluster DB.
    Nome del database databaseName Il nome del tuo database
    Nome tabella tableName Il nome della tabella nel cluster di database
    Segreto ARN credentialsSecretArn Il ARN dei AWS Secrets Manager chiave per il tuo cluster DB
Pinecone
Nota

Se usi Pinecone, l'utente accetta di autorizzare AWS accedere alla fonte di terze parti designata per tuo conto al fine di fornirti i servizi di vector store. Sei responsabile di rispettare tutti i termini di terze parti applicabili all'uso e al trasferimento dei dati dal servizio di terze parti.

Per una documentazione dettagliata sulla configurazione di un archivio vettoriale in Pinecone, vedi Pinecone come knowledge base per Amazon Bedrock.

Mentre configuri l'archivio vettoriale, prendi nota delle informazioni seguenti, da inserire al momento della creazione di una knowledge base:

  • Stringa di connessione: l'endpoint URL per la pagina di gestione dell'indice.

  • Namespace: (Facoltativo) Lo spazio dei nomi da utilizzare per scrivere nuovi dati nel database. Per ulteriori informazioni, consulta Utilizzo degli spazi dei nomi.

Esistono configurazioni aggiuntive che è necessario fornire durante la creazione di un Pinecone indice:

  • Nome: il nome dell'indice vettoriale. Scegli un nome valido. Successivamente, quando crei la knowledge base, inserisci il nome che scegli nel campo Nome dell'indice vettoriale.

  • Dimensioni: il numero di dimensioni nel vettore. Fate riferimento alla tabella seguente per determinare quante dimensioni deve contenere il vettore.

    Modello Dimensioni
    Titan Incorporamenti G1 - Testo 1.536
    Titan Incorporamenti V2 - Testo 1,024
    Cohere Embed Italiano 1,024
    Cohere Embed Multilingue 1,024
  • Metrica di distanza: la metrica utilizzata per misurare la similarità tra i vettori. Ti consigliamo di sperimentare metriche diverse per il tuo caso d'uso. Ti consigliamo di iniziare con la somiglianza del coseno.

Per accedere al tuo Pinecone indice, devi fornire il tuo Pinecone APIchiave per Amazon Bedrock attraverso il AWS Secrets Manager.

Per creare un segreto per il tuo Pinecone configurazione
  1. Segui i passaggi indicati in Crea un AWS Secrets Manager secret, impostando la chiave come apiKey e il valore come API chiave per accedere al Pinecone indice.

  2. Per trovare la tua API chiave, apri la console Pinecone e seleziona API Chiavi.

  3. Dopo aver creato il segreto, prendi nota ARN della KMS chiave.

  4. Assegna le autorizzazioni al tuo ruolo di servizio per decrittografare la KMS chiave seguendo la procedura riportata ARN di seguito. Autorizzazioni per decrittografare un AWS Secrets Manager segreto per l'archivio vettoriale contenente la tua knowledge base

  5. Successivamente, quando creerai la tua knowledge base, inseriscila ARN nel campo segreto Credenziali. ARN

Redis Enterprise Cloud
Nota

Se usi Redis Enterprise Cloud, l'utente accetta di autorizzare AWS accedere alla fonte di terze parti designata per tuo conto al fine di fornirti i servizi di vector store. Sei responsabile del rispetto di tutti i termini di terze parti applicabili all'uso e al trasferimento dei dati dal servizio di terze parti.

Per una documentazione dettagliata sulla configurazione di un archivio vettoriale in Redis Enterprise Cloud, vedi Integrazione Redis Enterprise Cloud con Amazon Bedrock.

Mentre configuri l'archivio vettoriale, prendi nota delle informazioni seguenti, da inserire al momento della creazione di una knowledge base:

  • Endpoint URL: l'endpoint pubblico URL per il tuo database.

  • Nome dell'indice vettoriale: il nome dell'indice vettoriale del database.

  • Campo vettoriale: il nome del campo in cui verranno archiviati gli incorporamenti vettoriali. Fate riferimento alla tabella seguente per determinare quante dimensioni deve contenere il vettore.

    Modello Dimensioni
    Titan Incorporamenti G1 - Testo 1.536
    Titan Incorporamenti V2 - Testo 1,024
    Cohere Embed Italiano 1,024
    Cohere Embed Multilingue 1,024
  • Campo di testo: il nome del campo in cui Amazon Bedrock archivia i blocchi di testo non elaborato.

  • Campo di metadati gestito da Bedrock: il nome del campo in cui Amazon Bedrock archivia i metadati relativi alla tua knowledge base.

Per accedere al tuo Redis Enterprise Cloud cluster, devi fornire il tuo Redis Enterprise Cloud configurazione di sicurezza su Amazon Bedrock tramite AWS Secrets Manager.

Per impostare un segreto per il tuo Redis Enterprise Cloud configurazione
  1. Abilita TLS l'utilizzo del tuo database con Amazon Bedrock seguendo i passaggi descritti in Transport Layer Security (TLS).

  2. Segui i passaggi indicati in Crea un AWS Secrets Manager segreto. Imposta le seguenti chiavi con i valori appropriati del tuo Redis Enterprise Cloud configurazione segreta:

    • username— Il nome utente per accedere al tuo Redis Enterprise Cloud database. Per trovare il nome utente, consulta la sezione Security del tuo database nella console Redis.

    • password— La password per accedere al tuo Redis Enterprise Cloud banca dati. Per trovare la password, consulta la sezione Security del tuo database nella console Redis.

    • serverCertificate: i contenuti del certificato rilasciato dall'autorità di certificazione Redis Cloud. Scarica il certificato del server dalla console di amministrazione Redis seguendo i passaggi in Download dei certificati.

    • clientPrivateKey: la chiave privata del certificato rilasciato dall'autorità di certificazione Redis Cloud. Scarica il certificato del server dalla console di amministrazione Redis seguendo i passaggi in Download dei certificati.

    • clientCertificate: la chiave pubblica del certificato rilasciato dall'autorità di certificazione Redis Cloud. Scarica il certificato del server dalla console di amministrazione Redis seguendo i passaggi in Download dei certificati.

  3. Dopo aver creato il segreto, prendine notaARN. Successivamente, quando creerai la tua knowledge base, inseriscila ARN nel ARN campo segreto Credenziali.

MongoDB Atlas
Nota

Se utilizzi MongoDB Atlas, accetti di autorizzare AWS per accedere alla fonte di terze parti designata per tuo conto al fine di fornirti servizi di archiviazione vettoriale. Sei responsabile di rispettare tutti i termini di terze parti applicabili all'uso e al trasferimento dei dati dal servizio di terze parti.

Per una documentazione dettagliata sulla configurazione di un archivio vettoriale in MongoDB Atlas, consulta MongoDB Atlas come knowledge base per Amazon Bedrock.

Quando configuri il vector store, prendi nota delle seguenti informazioni che aggiungerai quando creerai una knowledge base:

  • Endpoint URL: l'endpoint URL del cluster MongoDB Atlas.

  • Nome del database: il nome del database nel cluster MongoDB Atlas.

  • Nome della raccolta: il nome della raccolta nel database.

  • Credenziali segrete ARN: l'Amazon Resource Name (ARN) del segreto che hai creato in AWS Secrets Manager che contiene il nome utente e la password per un utente del database nel tuo cluster MongoDB Atlas.

  • (Facoltativo) KMS Chiave gestita dal cliente per il segreto delle credenziali ARN: se hai crittografato le tue credenziali segreteARN, fornisci la chiave in KMS modo che Amazon Bedrock possa decrittografarla.

Esistono configurazioni aggiuntive per la mappatura dei campi che è necessario fornire durante la creazione di un indice MongoDB Atlas:

  • Nome dell'indice vettoriale: il nome dell'indice di ricerca vettoriale MongoDB Atlas nella tua raccolta.

  • Nome campo vettoriale: il nome del campo in cui Amazon Bedrock deve archiviare gli incorporamenti vettoriali.

  • Nome del campo di testo: il nome del campo in cui Amazon Bedrock deve archiviare il testo non elaborato.

  • Nome del campo di metadati: il nome del campo in cui Amazon Bedrock deve archiviare i metadati di attribuzione di origine.

(Facoltativo) Per connettere Amazon Bedrock al tuo cluster AWS PrivateLink MongoDB Atlas, consulta il RAGflusso di lavoro con MongoDB Atlas utilizzando Amazon Bedrock.