Synchronisieren Sie Ihre Daten mit Ihrer Amazon Bedrock-Wissensdatenbank

Nachdem Sie Ihre Wissensdatenbank erstellt haben, nehmen Sie Ihre Daten auf oder synchronisieren sie, sodass sie abgefragt werden können. Bei der Aufnahme werden die Rohdaten in Ihrer Datenquelle auf der Grundlage des von Ihnen angegebenen Vektor-Einbettungsmodells und der von Ihnen angegebenen Konfigurationen in Vektoreinbettungen umgewandelt.

Bevor Sie mit der Aufnahme beginnen, überprüfen Sie, ob Ihre Datenquelle die folgenden Bedingungen erfüllt:

Sie haben die Verbindungsinformationen für Ihre Datenquelle konfiguriert. Informationen zum Konfigurieren eines Datenquellen-Connectors zum Crawlen Ihrer Daten aus Ihrem Datenquellen-Repository finden Sie unter Unterstützte Datenquellen-Connectors. Sie konfigurieren Ihre Datenquelle im Rahmen der Erstellung Ihrer Wissensdatenbank.
Sie haben das von Ihnen gewählte Vektor-Einbettungsmodell und den Vektorspeicher konfiguriert. Wissensdatenbanken finden Sie unter Unterstützte Modelle für Vektoreinbettungen und Vektorspeicher. Sie konfigurieren Ihre Vektoreinbettungen im Rahmen der Erstellung Ihrer Wissensdatenbank.
Die Dateien liegen in unterstützten Formaten vor. Weitere Informationen finden Sie unter Support von Dokumentformaten.
Die Dateien überschreiten nicht die in Amazon Bedrock Endpoints angegebene Dateigröße für den Ingestion-Job und die Kontingente in der. Allgemeine AWS-Referenz
Wenn Ihre Datenquelle Metadatendateien enthält, überprüfen Sie die folgenden Bedingungen, um sicherzustellen, dass die Metadatendateien nicht ignoriert werden:
- Jede .metadata.json Datei hat denselben Dateinamen und dieselbe Erweiterung wie die Quelldatei, mit der sie verknüpft ist.
- Wenn sich der Vektorindex für Ihre Wissensdatenbank in einem Amazon OpenSearch Serverless Vector Store befindet, überprüfen Sie, ob der Vektorindex mit der faiss Engine konfiguriert ist. Wenn der Vektorindex mit der nmslib Engine konfiguriert ist, müssen Sie einen der folgenden Schritte ausführen:
  - Erstellen Sie eine neue Wissensdatenbank in der Konsole und lassen Sie Amazon Bedrock automatisch einen Vektorindex in Amazon OpenSearch Serverless für Sie erstellen.
  - Erstellen Sie einen weiteren Vektorindex im Vektorspeicher und wählen Sie ihn faiss als Engine aus. Erstellen Sie dann eine neue Wissensdatenbank und geben Sie den neuen Vektorindex an.
- Wenn sich der Vektorindex für Ihre Wissensdatenbank in einem Amazon Aurora Aurora-Datenbankcluster befindet, überprüfen Sie, ob die Tabelle für Ihren Index eine Spalte für jede Metadateneigenschaft in Ihren Metadatendateien enthält, bevor Sie mit der Aufnahme beginnen.

Jedes Mal, wenn Sie Dateien zu Ihrer Datenquelle hinzufügen, ändern oder entfernen, müssen Sie die Datenquelle synchronisieren, damit sie erneut mit der Wissensdatenbank indexiert wird. Die Synchronisierung erfolgt inkrementell, sodass Amazon Bedrock nur Dokumente verarbeitet, die seit der letzten Synchronisierung hinzugefügt, geändert oder gelöscht wurden.

Um zu erfahren, wie Sie Ihre Daten in Ihre Wissensdatenbank aufnehmen und mit Ihren neuesten Daten synchronisieren können, wählen Sie die Registerkarte für Ihre bevorzugte Methode und folgen Sie dann den Schritten:

Console

Um Ihre Daten in Ihre Wissensdatenbank aufzunehmen und mit Ihren neuesten Daten zu synchronisieren

Öffnen Sie die Amazon Bedrock-Konsole unter https://console.aws.amazon.com/bedrock/.
Klicken Sie im linken Navigationsbereich auf Wissensdatenbank und wählen Sie Ihre Wissensdatenbank aus.
Wählen Sie im Bereich Datenquelle die Option Synchronisieren aus, um mit der Datenaufnahme oder der Synchronisierung Ihrer neuesten Daten zu beginnen. Um eine Datenquelle zu beenden, die gerade synchronisiert wird, wählen Sie Stopp aus. Eine Datenquelle muss gerade synchronisiert werden, um die Synchronisierung der Datenquelle zu beenden. Sie können erneut Synchronisieren auswählen, um den Rest Ihrer Daten aufzunehmen.
Wenn die Datenaufnahme abgeschlossen ist, wird ein grünes Banner angezeigt, wenn sie erfolgreich war.

Anmerkung
Nach Abschluss der Datensynchronisierung kann es einige Minuten dauern, bis die Vektoreinbettungen der neu synchronisierten Daten in Ihrer Wissensdatenbank angezeigt werden und für Abfragen verfügbar sind, wenn Sie einen anderen Vektorspeicher als Amazon Aurora () verwenden. RDS
Sie können eine Datenquelle auswählen, um deren Synchronisierungsverlauf anzuzeigen. Wählen Sie Warnungen anzeigen aus, um zu sehen, warum ein Datenerfassungsauftrag fehlgeschlagen ist.

API

Um Ihre Daten in Ihre Wissensdatenbank aufzunehmen und mit Ihren neuesten Daten zu synchronisieren, senden Sie eine StartIngestionJobAnfrage an einen Build-Time-Endpunkt von Agents for Amazon Bedrock. Geben Sie das und an. knowledgeBaseId dataSourceId Sie können einen Datenaufnahmeauftrag, der gerade ausgeführt wird, auch beenden, indem Sie eine StopIngestionJobAnfrage senden. Geben SiedataSourceId, und aningestionJobId. knowledgeBaseId Ein Datenaufnahmeauftrag muss derzeit ausgeführt werden, um die Datenaufnahme zu beenden. Sie können erneut eine StartIngestionJob Anfrage senden, um den Rest Ihrer Daten aufzunehmen, wenn Sie bereit sind.

Verwenden Sie die in der Antwort in einer GetIngestionJobAnfrage mit einem Build-Time-Endpunkt von Agents for Amazon Bedrock ingestionJobId zurückgegebenen Daten, um den Status des Aufnahmejobs zu verfolgen. Geben Sie außerdem den Wert und an. knowledgeBaseId dataSourceId

Bei Abschluss des Aufnahmeauftrags lautet der status in der Antwort COMPLETE.

Anmerkung
Nach Abschluss der Datenaufnahme kann es einige Minuten dauern, bis die Vektoreinbettungen der neu aufgenommenen Daten im Vektorspeicher für Abfragen verfügbar sind, wenn Sie einen anderen Vektorspeicher als Amazon Aurora () verwenden. RDS
Das statistics-Objekt in der Antwort liefert Informationen darüber, ob die Aufnahme der Dokumente in der Datenquelle erfolgreich war oder nicht.

Sie können auch Informationen zu allen Aufnahmeaufträgen für eine Datenquelle anzeigen, indem Sie eine ListIngestionJobsAnfrage mit einem Build-Time-Endpunkt von Agents for Amazon Bedrock senden. Geben Sie die dataSourceId und die Wissensdatenbank knowledgeBaseId an, in die die Daten aufgenommen werden.

Filtern Sie nach Ergebnissen, indem Sie einen Status angeben, nach dem im filters-Objekt gesucht werden soll.
Sortieren Sie nach dem Zeitpunkt, zu dem der Auftrag gestartet wurde, oder nach dem Status eines Auftrags, indem Sie das sortBy-Objekt angeben. Sie können in aufsteigender () oder absteigender () Reihenfolge sortieren.
Im Feld maxResults können Sie die Höchstzahl der Ergebnisse in einer Antwort bestimmen. Wenn es mehr Ergebnisse als die von Ihnen festgelegte Höchstzahl gibt, gibt die Antwort ein nextToken zurück, das Sie in einer weiteren ListIngestionJobs-Anforderung senden können, um den nächsten Auftragsstapel zu sehen.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Richten Sie Sicherheitskonfigurationen für Ihre Wissensdatenbank ein

Nehmen Sie Änderungen direkt in eine Wissensdatenbank auf

Synchronisieren Sie Ihre Daten mit Ihrer Amazon Bedrock-Wissensdatenbank

Um Ihre Daten in Ihre Wissensdatenbank aufzunehmen und mit Ihren neuesten Daten zu synchronisieren

Anmerkung

Anmerkung