Crea una knowledge base collegandoti a un'origine dati in Amazon Bedrock Knowledge Bases

Quando crei una knowledge base collegandoti a una fonte di dati, configuri o specifichi quanto segue:

Informazioni generali che definiscono e identificano la knowledge base
Il ruolo di servizio con autorizzazioni per l'accesso alla knowledge base.
Configurazioni per la knowledge base, incluso il modello di incorporamento da utilizzare per la conversione dei dati dall'origine dati, le configurazioni di archiviazione per il servizio in cui archiviare gli incorporamenti e, facoltativamente, una posizione S3 per archiviare i dati multimodali.

Nota

Non è possibile creare una knowledge base con un utente root. Accedi con un utente IAM prima di iniziare questi passaggi.

Espandi la sezione corrispondente al tuo caso d'uso:

Per creare una knowledge base

Accedi all' AWS Management Console utilizzo di un ruolo IAM con autorizzazioni Amazon Bedrock e apri la console Amazon Bedrock all'indirizzo. https://console.aws.amazon.com/bedrock/
Nel riquadro di navigazione a sinistra, scegli Knowledge base.
Nella sezione Knowledge base, scegli il pulsante Crea e seleziona per creare una knowledge base con un archivio vettoriale.
(Facoltativo) Modifica il nome predefinito e fornisci una descrizione per la tua knowledge base.
Scegli un ruolo AWS Identity and Access Management (IAM) che fornisca l'autorizzazione ad Amazon Bedrock per accedere ad altri AWS servizi richiesti. Puoi lasciare che Amazon Bedrock crei il ruolo di servizio o scegliere un ruolo personalizzato che hai creato.
Scegli una fonte di dati a cui collegare la tua knowledge base.
(Facoltativo) Aggiungi tag alla tua knowledge base. Per ulteriori informazioni, consulta Etichettare le risorse di Amazon Bedrock.
(Facoltativo) Configura i servizi per i quali fornire i registri delle attività per la tua knowledge base.
Vai alla sezione successiva e segui i passaggi indicati Connect una fonte di dati alla tua knowledge base per configurare un'origine dati.
Nella sezione Embeddings model, procedi come segue:
1. Scegli un modello di incorporamento per convertire i dati in incorporamenti vettoriali.
2. (Facoltativo) Espandi la sezione Configurazioni aggiuntive per visualizzare le seguenti opzioni di configurazione (non tutti i modelli supportano tutte le configurazioni):
  - Tipo di incorporamenti: se convertire i dati in incorporamenti vettoriali a virgola mobile (float32) (più precisi ma più costosi) o incorporamenti vettoriali binari (meno precisi, ma meno costosi). Per scoprire quali modelli di incorporamento supportano i vettori binari, consulta i modelli di incorporamento supportati.
  - Dimensioni vettoriali: valori più elevati migliorano la precisione ma aumentano i costi e la latenza.
Nella sezione Database vettoriale, effettuate le seguenti operazioni:
1. Scegliete un archivio vettoriale per memorizzare gli incorporamenti vettoriali che verranno utilizzati per l'interrogazione. Sono disponibili le seguenti opzioni:
  - Crea rapidamente un nuovo archivio vettoriale: scegli uno degli archivi vettoriali disponibili per Amazon Bedrock da creare.
    Amazon OpenSearch Serverless — Amazon Bedrock Knowledge Bases crea una raccolta e un indice di ricerca vettoriale Amazon OpenSearch Serverless e la configura con i campi richiesti per te.
    
    Amazon Aurora PostgreSQL Serverless: Amazon Bedrock configura un archivio vettoriale Amazon Aurora PostgreSQL Serverless. Questo processo prende dati di testo non strutturati da un bucket Amazon S3, li trasforma in blocchi di testo e vettori e quindi li archivia in un database PostgreSQL. Per ulteriori informazioni, consulta Creazione rapida di una Knowledge Base Aurora PostgreSQL per Amazon Bedrock.
    
    Amazon Neptune Analytics: Amazon Bedrock utilizza tecniche di Retrieval Augmented Generation (RAG) combinate con grafici per migliorare le applicazioni di intelligenza artificiale generativa in modo che gli utenti finali possano ottenere risposte più accurate e complete.
  - Scegli un archivio vettoriale che hai creato: seleziona un archivio vettoriale supportato e identifica i nomi dei campi vettoriali e i nomi dei campi di metadati nell'indice vettoriale. Per ulteriori informazioni, consulta Prerequisiti per il tuo archivio vettoriale per una knowledge base.
    
    Nota
    Se la tua origine dati è un'istanza Confluence SharePoint, Microsoft o Salesforce, l'unico servizio di archiviazione vettoriale supportato è Amazon Serverless. OpenSearch
2. (Facoltativo) Espandi la sezione Configurazioni aggiuntive e modifica le configurazioni pertinenti.
Se l'origine dati contiene immagini, specifica un URI Amazon S3 in cui archiviare le immagini che il parser estrarrà dai dati nella destinazione di archiviazione multimodale. Le immagini possono essere restituite durante l'interrogazione. Facoltativamente, puoi anche scegliere una chiave gestita dal cliente anziché quella predefinita Chiave gestita da AWS per crittografare i tuoi dati.

Nota
I dati multimodali sono supportati solo con Amazon S3 e origini dati personalizzate.
Scegli Avanti e rivedi i dettagli della tua knowledge base. Puoi modificare qualsiasi sezione prima di procedere e creare la tua knowledge base.

Nota
Il tempo necessario per creare la knowledge base dipende dalle configurazioni specifiche. Una volta completata la creazione della knowledge base, lo stato della knowledge base cambia e indica che è pronta o disponibile.
Una volta che la knowledge base è pronta e disponibile, sincronizza la fonte di dati per la prima volta e ogni volta che vuoi mantenere aggiornati i tuoi contenuti. Seleziona la tua knowledge base nella console e seleziona Sincronizza nella sezione panoramica delle fonti di dati.

Per creare una knowledge base, invia una CreateKnowledgeBaserichiesta a un endpoint di compilazione Agents for Amazon Bedrock.

Nota

Se preferisci lasciare che Amazon Bedrock crei e gestisca un archivio vettoriale per te, usa la console. Per ulteriori informazioni, espandi la sezione Usa la console in questo argomento.

I seguenti campi sono obbligatori:

Campo	Descrizione di base
nome	Un nome per la knowledge base
roleArn	L'ARN di un ruolo del servizio Amazon Bedrock Knowledge Bases.
knowledgeBaseConfiguration	Contiene le configurazioni per la knowledge base. Vedi i dettagli di seguito.
Configurazione dello storage	(Richiesto solo se ti connetti a un'origine dati non strutturata).Contiene le configurazioni per il servizio di origine dati scelto.

I seguenti campi sono facoltativi:

Campo	Caso d'uso
description	Una descrizione per la knowledge base.
clientToken	Per garantire che la richiesta API venga completata una sola volta. Per ulteriori informazioni, consulta Garantire l'idempotenza.
tags	Per associare i tag al flusso. Per ulteriori informazioni, consulta Etichettare le risorse di Amazon Bedrock.

Nel knowledgeBaseConfiguration campo, che corrisponde a un KnowledgeBaseConfigurationoggetto, specificate VECTOR nel type campo e includete un VectorKnowledgeBaseConfigurationoggetto. Nell'oggetto, includi i seguenti campi:

embeddingModelArn— L'ARN del modello di incorporamento da utilizzare.
embeddingModelConfiguration— Configurazioni per il modello di incorporamento. Per visualizzare i possibili valori che è possibile specificare per ogni modello supportato, vedere. Regioni e modelli supportati per le knowledge base di Amazon Bedrock
(Se prevedi di includere dati multimodali, che includono immagini, figure, grafici o tabelle, nella tua knowledge base)supplementalDataStorageConfiguration: esegue il mapping su un SupplementalDataStorageLocationoggetto, in cui specifichi la posizione S3 in cui archiviare i dati estratti. Per ulteriori informazioni, consulta Opzioni di analisi per la tua fonte di dati.

Nel storageConfiguration campo, che corrisponde a un StorageConfigurationoggetto, specifica l'archivio vettoriale a cui intendi connetterti nel type campo e includi il campo che corrisponde a quell'archivio vettoriale. Consulta ogni tipo di configurazione dell'archivio vettoriale all'indirizzo StorageConfigurationper i dettagli sulle informazioni che devi fornire.

Di seguito viene illustrato un esempio di richiesta per creare una knowledge base connessa a una raccolta Amazon OpenSearch Serverless. I dati provenienti da fonti di dati connesse verranno convertiti in incorporamenti vettoriali binari con Amazon Titan Text Embeddings V2 e i dati multimodali estratti dal parser sono configurati per essere archiviati in un bucket chiamato. MyBucket


PUT /knowledgebases/ HTTP/1.1
Content-type: application/json

{
   "name": "MyKB",
   "description": "My knowledge base",
   "roleArn": "arn:aws:iam::111122223333:role/service-role/AmazonBedrockExecutionRoleForKnowledgeBase_123",
   "knowledgeBaseConfiguration": {
      "type": "VECTOR",
      "vectorKnowledgeBaseConfiguration": { 
         "embeddingModelArn": "arn:aws:bedrock:us-east-1::foundation-model/amazon.titan-embed-text-v2:0",
         "embeddingModelConfiguration": { 
            "bedrockEmbeddingModelConfiguration": { 
               "dimensions": 1024,
               "embeddingDataType": "BINARY"
            }
         },
         "supplementalDataStorageConfiguration": { 
            "storageLocations": [ 
               { 
                  "s3Location": { 
                     "uri": "arn:aws:s3:::MyBucket"
                  },
                  "type": "S3"
               }
            ]
         }
      }
   },
   "storageConfiguration": { 
      "opensearchServerlessConfiguration": { 
         "collectionArn": "arn:aws:aoss:us-east-1:111122223333:collection/abcdefghij1234567890",
         "fieldMapping": { 
            "metadataField": "metadata",
            "textField": "text",
            "vectorField": "vector"
         },
         "vectorIndexName": "MyVectorIndex"
      }
   }
}

Argomenti

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Prerequisiti per l'utilizzo del proprio archivio vettoriale

Connect una fonte di dati