Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Crea una knowledge base gestita
Quando crei una knowledge base gestita, Amazon Bedrock AgentCore gestisce l'infrastruttura di storage, indicizzazione e recupero per te. Per impostazione predefinita, viene utilizzato un modello di incorporamento gestito dai servizi e non è richiesta alcuna selezione o configurazione del modello. Facoltativamente, puoi invece fornire il tuo modello di incorporamento Bedrock. Facoltativamente, puoi anche fornire una chiave KMS per la crittografia dell'archivio vettoriale gestito.
Dopo aver creato la knowledge base, collegala a una fonte di dati e avvia l'acquisizione. Per informazioni dettagliate sulla connessione di un'origine dati, consulta Connettere un'origine dati. Per sincronizzare una fonte di dati, usa l'StartIngestionJobAPI. Per informazioni dettagliate, vedi Sincronizzare i dati con Knowledge Base per Amazon Bedrock.
Per imparare a creare una knowledge base gestita, scegli la scheda corrispondente al metodo che preferisci:
- Console
-
Per creare una knowledge base gestita
-
Accedi Console di gestione AWS e accedi ad Amazon Bedrock AgentCore > Built-in tools > Knowledge Base.
-
Scegli Crea una Knowledge Base gestita.
-
(Facoltativo) Espandi la sezione Configurazioni aggiuntive dei dettagli della Knowledge Base per configurare quanto segue:
-
Aggiungere una descrizione.
-
Scegliete un tipo di modello di incorporamento:
-
Gestito (impostazione predefinita): viene utilizzato un modello di incorporamento gestito dal servizio. Non è richiesta alcuna selezione o configurazione del modello.
-
Personalizzato: seleziona un modello di incorporamento Bedrock. Scegli il modello per aprire il selettore del modello, che mostra i fornitori e i modelli disponibili (Amazon, Cohere).
-
Configura le autorizzazioni IAM: scegli Crea e usa un nuovo ruolo di servizio (consigliato) o seleziona un ruolo esistente.
-
Configura la AWS KMS crittografia per l'archivio vettoriale AWS gestito (chiave gestita per impostazione predefinita o seleziona una chiave KMS personalizzata).
-
In Origine dati, fornisci il nome dell'origine dati.
-
Seleziona il tipo di origine dati dal menu a discesa: Amazon S3, Confluence, Custom, Google Drive o Web OneDrive Crawler SharePoint.
-
Configura le impostazioni di connessione all'origine dati per il tipo di origine dati selezionato.
-
(Facoltativo) Espandi Analisi e suddivisione in blocchi dei contenuti per configurare quanto segue:
-
(Facoltativo) Espandi le configurazioni avanzate per configurare l'indicizzazione avanzata. In Indicizzazione dei contenuti, l'impostazione predefinita indicizza i contenuti testuali dei documenti comuni. Abilita l'indicizzazione avanzata per modalità aggiuntive:
-
Contenuto visivo nei documenti: elabora gli elementi visivi incorporati nei file.pdf, .docx, .ppt, .pptx.
-
File audio: elabora file in formato.mp3, .wav, .m4a, .flac, .ogg.
-
File video: elabora file in formato.mp4, .mov, .m4v.
Opzionalmente, imposta una dimensione massima del file (MB) e configura la protezione per l'eliminazione dei documenti.
-
(Facoltativo) Configura la consegna dei log per inviare i log di ingestione della knowledge base a una destinazione come CloudWatch Logs, Amazon S3 o Firehose.
-
Scegli Crea Knowledge Base.
-
Attendi la creazione della knowledge base e della fonte di dati (2-5 minuti). Se crei una knowledge base gestita con una chiave gestita dal cliente, la creazione potrebbe richiedere più tempo.
- API
-
Di seguito è riportato un esempio di creazione di una knowledge base gestita e di configurazione dell'origine dati utilizzando l'API con l'SDK AWS CLI o supportato, come Python. Dopo la chiamata CreateKnowledgeBase, chiami CreateDataSourceper creare la fonte di dati contenente le informazioni di connessione. dataSourceConfiguration
Per informazioni sulle personalizzazioni che è possibile applicare all’importazione includendo il campo vectorIngestionConfiguration opzionale, consulta Personalizzare l’importazione per un’origine dati.
AWS Command Line Interface
Fase 1: Creare la knowledge base
Con un modello di incorporamento gestito (impostazione predefinita):
aws bedrock-agent create-knowledge-base \
--name "my-managed-kb" \
--role-arn "arn:aws:iam::123456789012:role/BedrockKBRole" \
--description "My managed knowledge base" \
--knowledge-base-configuration file://kb-config.json
kb-config.json
{
"type": "MANAGED",
"managedKnowledgeBaseConfiguration": {
"embeddingModelType": "MANAGED"
}
}
Con un modello di incorporamento personalizzato (modello Bedrock fornito dal cliente):
aws bedrock-agent create-knowledge-base \
--name "my-custom-embed-kb" \
--role-arn "arn:aws:iam::123456789012:role/BedrockKBRole" \
--description "My managed knowledge base with custom embedding" \
--knowledge-base-configuration file://kb-config.json
kb-config.json
{
"type": "MANAGED",
"managedKnowledgeBaseConfiguration": {
"embeddingModelType": "CUSTOM",
"embeddingModelArn": "arn:aws:bedrock:us-west-2::foundation-model/amazon.titan-embed-text-v2:0",
"embeddingModelConfiguration": {
"bedrockEmbeddingModelConfiguration": {
"dimensions": 1024
}
}
}
}
Quando embeddingModelType viene omesso, il valore predefinito è. MANAGED Durante l'utilizzoMANAGED, non è necessario specificare o. embeddingModelArn embeddingModelConfiguration Quando si utilizzaCUSTOM, entrambi i campi sono obbligatori.
Fase 2: Creare una fonte di dati
aws bedrock-agent create-data-source \
--name "S3-connector" \
--description "S3 data source connector for Amazon Bedrock to use content in S3" \
--knowledge-base-id "your-knowledge-base-id" \
--data-source-configuration file://bedrock-s3-managed-connector-configuration.json \
--data-deletion-policy "DELETE" \
--vector-ingestion-configuration '{"parsingConfiguration":{"parsingStrategy":"SMART_PARSING"}}'
bedrock-s3-managed-connector-configuration.json
{
"type": "MANAGED_KNOWLEDGE_BASE_CONNECTOR",
"managedKnowledgeBaseConnectorConfiguration": {
"mediaExtractionConfiguration": {
"imageExtractionConfiguration": {
"imageExtractionStatus": "ENABLED"
}
},
"connectorParameters": {
"type": "S3",
"version": "1",
"connectionConfiguration": {
"bucketName": "your-test-s3-bucket",
"bucketOwnerAccountId": "123456789012"
},
"deletionProtectionConfiguration": {
"enableDeletionProtection": false
}
}
}
}
Opzioni del modello di incorporamento
Le knowledge base gestite supportano due tipi di modelli di incorporamento:
-
Incorporamento gestito (impostazione predefinita): un modello di incorporamento gestito dal servizio viene utilizzato automaticamente. Non è necessario selezionare un modello, configurare le dimensioni o gestire i limiti del servizio Bedrock per l'incorporamento. Il servizio gestisce la selezione, l'hosting e la scalabilità dei modelli in modo trasparente.
-
Incorporamento personalizzato: fornisci il tuo modello di incorporamento Bedrock ARN. Quando si utilizza un modello di incorporamento personalizzato, è necessario specificare le dimensioni del modello (1024) e il tipo di dati di incorporamento float32. Sono supportati i seguenti modelli di incorporamento Bedrock:
-
Embedding di testo Amazon Titan V2
-
Cohere Embed English v3
-
Cohere Embed Multilingue v3
-
Cohere Embed v4
-
Incorporamenti multimodali Amazon Nova
Non è possibile modificare il tipo di modello di incorporamento dopo aver creato la knowledge base. Per passare dall'incorporamento gestito a quello personalizzato, è necessario creare una nuova knowledge base.
Se si crea una knowledge base con un modello di incorporamento personalizzato, il reranker gestito non è disponibile per quella knowledge base. Per utilizzare il reranker gestito, crea la tua knowledge base con il modello di incorporamento gestito predefinito.
Connettori di origine dati supportati
Le knowledge base gestite supportano i seguenti connettori di origine dati:
Per informazioni sulla configurazione dei connettori delle sorgenti dati, consulta Connect a data source.