Synchronisieren einer Datenquelle

Nachdem Sie Ihre Wissensdatenbank erstellt haben, nehmen Sie Ihre Daten auf oder synchronisieren, damit die Daten abgefragt werden können. Bei der Aufnahme werden die Rohdaten in Ihrer Datenquelle in Vektoreinbettungen umgewandelt.

Bevor Sie mit der Aufnahme beginnen, überprüfen Sie, ob Ihre Datenquelle die folgenden Bedingungen erfüllt:

Sie haben die Verbindungsinformationen für Ihre Datenquelle konfiguriert. Siehe Eine Datenquelle Connect. Sie konfigurieren Ihre Datenquelle im Rahmen der Erstellung Ihrer Wissensdatenbank.
Sie haben das von Ihnen gewählte Modell für Vektoreinbettungen konfiguriert. Sehen Sie sich die unterstützten Modelle für Vektoreinbettungen an. Sie konfigurieren Ihre Vektoreinbettungen im Rahmen der Erstellung Ihrer Wissensdatenbank.
Die Dateien haben unterstützte Formate. Weitere Informationen finden Sie unter Unterstützte Dokumentformate.
Die Dateien überschreiten nicht die Größe der Datei für den Aufnahmejob, die in der AWS Allgemeinen Referenz unter Dienstkontingente und Kontingente angegeben ist.

Jedes Mal, wenn Sie Dateien zu Ihrer Datenquelle hinzufügen, ändern oder daraus entfernen, müssen Sie die Datenquelle synchronisieren, damit sie erneut mit der Wissensdatenbank indexiert wird. Die Synchronisierung erfolgt inkrementell, sodass Amazon Bedrock nur Dokumente verarbeitet, die seit der letzten Synchronisierung hinzugefügt, geändert oder gelöscht wurden.

Wählen Sie die Registerkarte für Ihre bevorzugte Methode aus, um zu erfahren, wie Sie Ihre Daten in Ihre Wissensdatenbank aufnehmen und mit Ihren neuesten Daten synchronisieren, und führen Sie dann die folgenden Schritte aus:

Console

So nehmen Sie Ihre Daten in Ihre Wissensdatenbank auf und synchronisieren sie mit Ihren neuesten Daten

Melden Sie sich bei Amazon Bedrock an AWS-Managementkonsole und navigieren Sie zu Amazon Bedrock AgentCore > Built-in Tools > Knowledge Base.
Wählen Sie Ihre Wissensdatenbank aus.
Wählen Sie im Abschnitt Datenquelle die Option Synchronisieren aus, um mit der Erfassung oder Synchronisierung Ihrer neuesten Daten zu beginnen. Klicken Sie auf Stopp, um eine laufende Datenquellensynchronisierung zu stoppen. Eine Datenquelle muss gerade synchronisiert werden, um die Synchronisierung zu stoppen. Sie können erneut Synchronisieren auswählen, um den Rest Ihrer Daten aufzunehmen.
Wenn die Datenaufnahme abgeschlossen ist, wird ein grünes Banner angezeigt, wenn sie erfolgreich war.
Sie können eine Datenquelle auswählen, um deren Synchronisierungsverlauf anzuzeigen. Wählen Sie Warnungen anzeigen aus, um zu sehen, warum ein Datenerfassungsauftrag fehlgeschlagen ist.

API

Um Ihre Daten in Ihre Wissensdatenbank aufzunehmen und mit Ihren neuesten Daten zu synchronisieren, senden Sie eine StartIngestionJobAnfrage an einen Build-Time-Endpunkt von Agents for Amazon Bedrock. Geben Sie die knowledgeBaseId und die dataSourceId an. Sie können einen Datenaufnahmejob, der gerade ausgeführt wird, auch beenden, indem Sie eine Anfrage senden. StopIngestionJob Geben Sie die dataSourceId, ingestionJobId und die knowledgeBaseId an. Ein Datenerfassungsauftrag muss derzeit ausgeführt werden, um die Datenaufnahme zu beenden. Sie können erneut eine StartIngestionJob-Anfrage senden, um den Rest Ihrer Daten aufzunehmen, wenn Sie bereit sind.

Verwenden Sie die in der Antwort in einer GetIngestionJobAnfrage mit einem Build-Time-Endpunkt von Agents for Amazon Bedrock ingestionJobId zurückgegebenen Daten, um den Status des Aufnahmejobs zu verfolgen. Geben Sie zusätzlich die knowledgeBaseId und die dataSourceId an.

Bei Abschluss des Aufnahmeauftrags lautet der status in der Antwort COMPLETE.
Das statistics-Objekt in der Antwort liefert Informationen darüber, ob die Aufnahme der Dokumente in der Datenquelle erfolgreich war oder nicht.

Sie können auch Informationen zu allen Aufnahmeaufträgen für eine Datenquelle anzeigen, indem Sie eine ListIngestionJobsAnfrage mit einem Build-Time-Endpunkt von Agents for Amazon Bedrock senden. Geben Sie die dataSourceId und die knowledgeBaseId der Wissensdatenbank an, in die die Daten aufgenommen werden.

Filtern Sie nach Ergebnissen, indem Sie einen Status angeben, nach dem im filters-Objekt gesucht werden soll.
Sortieren Sie nach dem Zeitpunkt, zu dem der Auftrag gestartet wurde, oder nach dem Status eines Auftrags, indem Sie das sortBy-Objekt angeben. Sie können in aufsteigender () oder absteigender () Reihenfolge sortieren.
Im Feld maxResults können Sie die Höchstzahl der Ergebnisse in einer Antwort bestimmen. Wenn es mehr Ergebnisse als die von Ihnen festgelegte Höchstzahl gibt, gibt die Antwort ein nextToken zurück, das Sie in einer weiteren ListIngestionJobs-Anforderung senden können, um den nächsten Auftragsstapel zu sehen.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Beobachtbarkeit

Anzeigen der Informationen zu einer Datenquelle