Sincronizza i tuoi dati con la tua knowledge base Amazon Bedrock - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Sincronizza i tuoi dati con la tua knowledge base Amazon Bedrock

Dopo aver creato la knowledge base, acquisisci o sincronizzi i dati in modo che possano essere interrogati. Ingestion converte i dati grezzi della fonte di dati in incorporamenti vettoriali, in base al modello di incorporamenti vettoriali e alle configurazioni specificati.

Prima di iniziare l'importazione, verificate che la fonte di dati soddisfi le seguenti condizioni:

  • Hai configurato le informazioni di connessione per la tua fonte di dati. Per configurare un connettore di origine dati per eseguire la scansione dei dati dal repository di origini dati, consulta Connettori di origini dati supportati. La configurazione dell'origine dati viene effettuata nell'ambito della creazione della knowledge base.

  • Hai configurato il modello di incorporamenti vettoriali e l'archivio vettoriale scelti. Consulta i modelli di incorporamento vettoriale e gli archivi vettoriali supportati per le knowledge base. Gli incorporamenti vettoriali vengono configurati come parte della creazione della knowledge base.

  • I file sono nei formati supportati. Per ulteriori informazioni, consulta Support document formats.

  • I file non superano le dimensioni del file di processo di ingestione specificate negli endpoint Amazon Bedrock e le quote in. Riferimenti generali di AWS

  • Se la tua fonte di dati contiene file di metadati, verifica le seguenti condizioni per assicurarti che i file di metadati non vengano ignorati:

    • Ogni .metadata.json file condivide lo stesso nome e la stessa estensione del file sorgente a cui è associato.

    • Se l'indice vettoriale per la tua knowledge base si trova in un archivio vettoriale Amazon OpenSearch Serverless, verifica che l'indice vettoriale sia configurato con il motore. faiss Se l'indice vettoriale è configurato con il nmslib motore, dovrai eseguire una delle seguenti operazioni:

    • Se l'indice vettoriale per la tua knowledge base si trova in un cluster di database Amazon Aurora, verifica che la tabella dell'indice contenga una colonna per ogni proprietà dei metadati nei tuoi file di metadati prima di iniziare l'importazione.

Ogni volta che aggiungi, modifichi o rimuovi file dall'origine dati, devi sincronizzare l'origine dati in modo che venga reindicizzata nella knowledge base. La sincronizzazione è incrementale, quindi Amazon Bedrock elabora solo i documenti aggiunti, modificati o eliminati dall'ultima sincronizzazione.

Per sapere come inserire i dati nella tua knowledge base e sincronizzarli con i dati più recenti, seleziona la scheda corrispondente al metodo che preferisci e segui i passaggi:

Console
Per inserire i dati nella knowledge base e sincronizzarli con i dati più recenti
  1. Apri la console Amazon Bedrock all'indirizzo https://console.aws.amazon.com/bedrock/.

  2. Dal riquadro di navigazione a sinistra, seleziona la tua knowledge base da Knowledge base.

  3. Nella sezione Origine dati, seleziona Sincronizza per iniziare l'acquisizione dei dati o sincronizzare i dati più recenti. Per interrompere la sincronizzazione di un'origine dati attualmente, seleziona Stop. Un'origine dati deve essere attualmente sincronizzata per interrompere la sincronizzazione dell'origine dati. Puoi selezionare nuovamente Sincronizza per importare il resto dei tuoi dati.

  4. Al termine dell'importazione di dati, se l'operazione è riuscita, viene visualizzato un banner verde di successo.

    Nota

    Una volta completata la sincronizzazione dei dati, potrebbero essere necessari alcuni minuti prima che gli incorporamenti vettoriali dei dati appena sincronizzati si riflettano nella tua knowledge base e siano disponibili per l'interrogazione se utilizzi un archivio vettoriale diverso da Amazon Aurora (). RDS

  5. Puoi scegliere un'origine dati per visualizzarne la cronologia di sincronizzazione. Seleziona Visualizza avvisi per scoprire perché un processo di importazione di dati non è riuscito.

API

Per inserire i tuoi dati nella tua knowledge base e sincronizzarli con i dati più recenti, invia una StartIngestionJobrichiesta a un endpoint in fase di costruzione di Agents for Amazon Bedrock. Specificare e. knowledgeBaseId dataSourceId È inoltre possibile interrompere un processo di inserimento dati attualmente in esecuzione inviando una StopIngestionJobrichiesta. Specificare il dataSourceIdingestionJobId, e. knowledgeBaseId Un processo di inserimento dati deve essere attualmente in esecuzione per interrompere l'inserimento dei dati. Puoi inviare nuovamente una StartIngestionJob richiesta per importare il resto dei tuoi dati quando sei pronto.

Utilizza il valore ingestionJobId restituito nella risposta a una GetIngestionJobrichiesta con un endpoint di compilazione Agents for Amazon Bedrock per tenere traccia dello stato del processo di inserimento. Inoltre, specifica e. knowledgeBaseId dataSourceId

  • Al termine del processo di importazione, lo status della risposta è COMPLETE.

    Nota

    Una volta completata l'inserimento dei dati, potrebbero essere necessari alcuni minuti prima che gli incorporamenti vettoriali dei dati appena importati siano disponibili nel vector store per l'interrogazione se utilizzi un archivio vettoriale diverso da Amazon Aurora (). RDS

  • L'oggetto statistics nella risposta restituisce informazioni sull'esito, positivo o negativo, dell'importazione dei documenti nell'origine dati.

Puoi anche visualizzare le informazioni per tutti i lavori di inserimento per un'origine dati inviando una ListIngestionJobsrichiesta a un endpoint di build Agents for Amazon Bedrock. Specificate l'dataSourceIdindirizzo e la knowledgeBaseId della knowledge base in cui vengono importati i dati.

  • Filtra i risultati specificando lo stato da cercare nell'oggetto filters.

  • Ordina in base all'ora di avvio del processo o allo stato di un processo specificando l'oggetto sortBy. Puoi scegliere l'ordinamento crescente o decrescente.

  • Puoi impostare il numero massimo di risultati che dovranno essere restituiti nella risposta nel campo maxResults. Se i risultati sono superiori al numero impostato, la risposta restituisce un messaggio nextToken che è possibile inviare in un'altra ListIngestionJobsrichiesta per visualizzare il successivo batch di lavori.