Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Includi i metadati in una fonte di dati per migliorare l'interrogazione della knowledge base
Quando si importano file CSV (valori separati da virgola), è possibile fare in modo che la Knowledge Base tratti determinate colonne come campi di contenuto anziché campi di metadati. Invece di avere potenzialmente centinaia o migliaia di coppie di file content/metadati, ora puoi avere un singolo file CSV e un file metadata.json corrispondente, che forniscono alla knowledge base suggerimenti su come trattare ogni colonna all'interno del tuo CSV.
Esistono dei limiti per i campi/attributi dei metadati dei documenti per blocco. Vedi Quotas per le basi di conoscenza
Prima di importare un file CSV, assicurati di:
-
Il file CSV è in formato RFC418 0 ed è codificato in UTF-8.
-
La prima riga del file CSV include informazioni sull'intestazione.
-
I campi di metadati forniti in metadata.json sono presenti come colonne nel file CSV.
-
Fornisci un file Filename.csv.metadata.json con il seguente formato:
{ "metadataAttributes": { "${attribute1}": "${value1}", "${attribute2}": "${value2}", ... }, "documentStructureConfiguration": { "type": "RECORD_BASED_STRUCTURE_METADATA", "recordBasedStructureMetadata": { "contentFields": [ { "fieldName": "string" } ], "metadataFieldsSpecification": { "fieldsToInclude": [ { "fieldName": "string" } ], "fieldsToExclude": [ { "fieldName": "string" } ] } } } }
Il file CSV viene analizzato una riga alla volta e la strategia di suddivisione in blocchi e l'incorporamento vettoriale vengono applicati al campo del contenuto. Le knowledge base di Amazon Bedrock attualmente supportano un campo di contenuto. Il campo di contenuto è suddiviso in blocchi e i campi di metadati (colonne) associati a ciascun blocco vengono trattati come valori di stringa.
Ad esempio, supponiamo che ci sia un file CSV con una colonna «Descrizione» e una colonna «Creation_Date». Il campo descrizione è il campo del contenuto e la data di creazione è un campo di metadati associato. Il testo descrittivo viene suddiviso in blocchi e convertito in incorporamenti vettoriali per ogni riga del file CSV. Il valore della data di creazione viene considerato come una rappresentazione in formato stringa della data ed è associato a ciascun blocco della descrizione.
Se non vengono forniti campi di inclusione/esclusione, tutte le colonne vengono trattate come colonne di metadati, ad eccezione della colonna del contenuto. Se vengono forniti solo campi di inclusione, solo le colonne fornite vengono trattate come metadati. Se vengono forniti solo campi di esclusione, tutte le colonne, tranne le colonne di esclusione, vengono trattate come metadati. Se fornisci lo stesso fieldName
in entrambi fieldsToInclude
efieldsToExlcude
, Amazon Bedrock genera un'eccezione di convalida. Se c'è un conflitto tra inclusione ed esclusione, [esso] si tradurrà in un errore.
Le righe vuote trovate all'interno di un file CSV vengono ignorate o saltate.