Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Trasformare i dati in una base di conoscenze
Per creare una knowledge base, connettiti a una fonte di dati supportata a cui desideri che la knowledge base sia in grado di accedere. La tua knowledge base sarà in grado di rispondere alle domande degli utenti o generare risposte in base ai dati recuperati.
Amazon Bedrock Knowledge Bases supporta una varietà di documenti, tra cui testo, immagini o documenti multimodali che contengono tabelle, grafici, diagrammi e altre immagini. I dati multimodali si riferiscono a una combinazione di dati testuali e visivi. Esempi di tipi di file che contengono dati non strutturati sono text, markdown e. HTML PDFs
Le seguenti sezioni descrivono i tipi di dati supportati da Amazon Bedrock Knowledge Bases e i servizi a cui puoi connettere la tua knowledge base per ogni tipo di dati:
Dati non strutturati
I dati non strutturati si riferiscono a dati che non sono obbligati a rientrare in una struttura predefinita. Amazon Bedrock Knowledge Bases supporta la connessione ai seguenti servizi per aggiungere dati non strutturati alla tua knowledge base:
Amazon S3
Confluence (anteprima)
Microsoft SharePoint (anteprima)
Salesforce (anteprima)
Web Crawler (anteprima)
Fonte di dati personalizzata (consente l'inserimento diretto dei dati nelle knowledge base senza bisogno di sincronizzazione)
Una fonte di dati contiene la forma grezza dei tuoi documenti. Per ottimizzare il processo di interrogazione, una knowledge base converte i dati grezzi in incorporamenti vettoriali, una rappresentazione numerica dei dati, per quantificare la somiglianza con le query che vengono anche convertite in incorporamenti vettoriali. Amazon Bedrock Knowledge Bases utilizza le seguenti risorse nel processo di conversione dell'origine dati:
-
Modello di incorporamento: un modello di base che converte i dati in incorporamenti vettoriali.
-
Vector store: un servizio che memorizza la rappresentazione vettoriale dei dati. Sono supportati i seguenti archivi vettoriali:
-
Amazon OpenSearch Serverless
-
Amazon Neptune
-
Amazon Aurora () RDS
-
Pinecone
-
Redis Enterprise Cloud
-
MongoDB Atlas
-
Il processo di conversione dei dati in incorporamenti vettoriali si chiama ingestione. Il processo di inserimento che trasforma i dati in una knowledge base prevede i seguenti passaggi:
Ingestione
-
I dati vengono analizzati dal parser scelto. Per ulteriori informazioni sull'analisi, vedere. Opzioni di analisi per la tua fonte di dati
-
Ogni documento nell'origine dati è suddiviso in blocchi, suddivisioni dei dati che possono essere definite in base al numero di token e ad altri parametri. Per ulteriori informazioni sulla suddivisione in blocchi, consulta. Come funziona la suddivisione in blocchi dei contenuti per le knowledge base
-
Il modello di incorporamento scelto converte i dati in incorporamenti vettoriali.
-
Gli incorporamenti vettoriali vengono scritti in un indice vettoriale nell'archivio vettoriale scelto.
Una volta completato il processo di inserimento, la knowledge base è pronta per essere interrogata. Per informazioni su come interrogare e recuperare informazioni dalla Knowledge Base, vedere. Recupero di informazioni da fonti di dati utilizzando Amazon Bedrock Knowledge Bases
Se si apportano modifiche a un'origine dati, è necessario sincronizzare le modifiche per inserire aggiunte, modifiche ed eliminazioni nella knowledge base. Alcune fonti di dati supportano l'inserimento o l'eliminazione diretta di file nella knowledge base, eliminando la necessità di trattare la modifica e l'ingestione delle fonti di dati come fasi separate e la necessità di eseguire sempre sincronizzazioni complete. Per informazioni su come inserire i documenti direttamente nella knowledge base e nelle fonti di dati che la supportano, consulta. Inserisci le modifiche direttamente in una knowledge base
Amazon Bedrock Knowledge Bases offre diverse opzioni per personalizzare il modo in cui i dati vengono acquisiti. Per ulteriori informazioni sulla personalizzazione di questo processo, consulta. Personalizzazione della base di conoscenze
Dati strutturati
I dati strutturati si riferiscono ai dati tabulari in un formato predefinito dall'archivio dati in cui si trovano. Amazon Bedrock Knowledge Bases si connette agli archivi di dati strutturati supportati tramite il motore di query Amazon Redshift. Amazon Bedrock Knowledge Bases fornisce un meccanismo completamente gestito che analizza i modelli di query, la cronologia delle query e i metadati dello schema per convertire le query in linguaggio naturale in query. SQL Queste query convertite vengono quindi utilizzate per recuperare informazioni pertinenti dalle fonti di dati supportate.
Amazon Bedrock Knowledge Bases supporta la connessione ai seguenti servizi per aggiungere archivi di dati strutturati alla tua knowledge base:
Amazon Redshift
AWS Glue Data Catalog (AWS Lake Formation)
Se colleghi la tua knowledge base a un archivio di dati strutturato, non è necessario convertire i dati in incorporamenti vettoriali. Invece, le Amazon Bedrock Knowledge Bases possono interrogare direttamente l'archivio dati strutturato. Durante le interrogazioni, le Amazon Bedrock Knowledge Bases possono convertire le SQL query degli utenti in query per recuperare dati pertinenti alla richiesta dell'utente e generare risposte più accurate. Puoi anche generare SQL query senza recuperare dati e utilizzarle in altri flussi di lavoro.
Ad esempio, un archivio di database contiene la seguente tabella con informazioni sui clienti e sui loro acquisti:
ID cliente | Importo acquistato nel 2020 | Importo acquistato nel 2021 | Importo acquistato nel 2022 | Importo totale acquistato fino ad oggi |
---|---|---|---|---|
1 | 200 | 300 | 500 | 1000 |
2 | 150 | 100 | 120 | 370 |
3 | 300 | 300 | 300 | 900 |
4 | 720 | 180 | 100 | 900 |
5 | 500 | 400 | 100 | 1000 |
6 | 900 | 800 | 1000 | 2700 |
7 | 470 | 420 | 400 | 1290 |
8 | 250 | 280 | 250 | 780 |
9 | 620 | 830 | 740 | 2190 |
10 | 300 | 200 | 300 | 800 |
Se una richiesta dell'utente dice «dammi un riepilogo dei 5 clienti che hanno speso di più», la Knowledge Base può fare quanto segue:
-
Convertire l'interrogazione in un'SQLinterrogazione.
-
Restituisce un estratto dalla tabella che contiene quanto segue:
-
Colonne pertinenti della tabella «ID cliente» e «Importo totale acquistato fino ad oggi»
-
Righe della tabella contenenti l'importo totale degli acquisti per i 10 clienti che hanno speso di più
-
-
Genera una risposta che indichi quali clienti sono stati i 5 clienti che hanno speso di più e quanto hanno acquistato.
Altri esempi di interrogazioni per cui una knowledge base può generare un estratto di tabella includono:
-
«i 5 migliori clienti per spesa nel 2020"
-
«miglior cliente per importo di acquisto nel 2020"
-
«i primi 5 clienti per importo di acquisto nel periodo 2020-2022"
-
«i 5 clienti che hanno speso di più nel 2020-2022"
-
«clienti con un importo totale di acquisto inferiore a 10 USD»
-
«i 5 clienti con la spesa più bassa»
Più una query è specifica o dettagliata, più la Knowledge Base può restringere le informazioni esatte da restituire. Ad esempio, anziché la query «i 10 migliori clienti per spesa nel 2020", una query più specifica è «trova i 10 acquisti totali più alti fino ad oggi per i clienti nel 2020". La query specifica si riferisce al nome della colonna «Importo totale acquistato fino alla data» nella tabella del database delle spese dei clienti e indica inoltre che i dati devono essere ordinati per «importo più alto».