Erstellen eines Datenquellen-Connectors - Amazon Kendra

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erstellen eines Datenquellen-Connectors

Sie können einen Datenquellenconnector für erstellen Amazon Kendra um eine Verbindung zu Ihren Dokumenten herzustellen und sie zu indizieren. Amazon Kendra kann eine Verbindung zu Microsoft SharePoint, Google Drive und vielen anderen Anbietern herstellen. Wenn Sie einen Datenquellen-Connector erstellen, geben Sie Amazon Kendra die Konfigurationsinformationen, die für die Verbindung mit Ihrem Quell-Repository erforderlich sind. Im Gegensatz zum direkten Hinzufügen von Dokumenten zu einem Index können Sie die Datenquelle regelmäßig scannen, um den Index zu aktualisieren.

Nehmen wir zum Beispiel an, Sie haben ein Repository mit Steuerdokumenten, die in einem Amazon S3 Eimer. Von Zeit zu Zeit werden bestehende Dokumente geändert und neue Dokumente werden dem Repository hinzugefügt. Wenn Sie das Repository hinzufügen Amazon Kendra Als Datenquelle können Sie Ihren Index auf dem neuesten Stand halten, indem Sie regelmäßige Synchronisationen zwischen Ihrer Datenquelle und dem Index einrichten.

Sie können wählen, ob Sie einen Index manuell über die Konsole oder die StartDataSourceSyncJobAPIaktualisieren möchten. Andernfalls richten Sie einen Zeitplan ein, um einen Index zu aktualisieren und ihn mit Ihrer Datenquelle zu synchronisieren.

Ein Index kann mehr als eine Datenquelle haben. Jede Datenquelle kann ihren eigenen Aktualisierungszeitplan haben. Sie können beispielsweise den Index Ihrer Arbeitsdokumente täglich oder sogar stündlich aktualisieren, während Sie Ihre archivierten Dokumente bei jeder Änderung des Archivs manuell aktualisieren.

Wenn Sie die Metadaten oder Attribute und den Inhalt Ihres Dokuments während der Dokumentaufnahme ändern möchten, finden Sie unter Amazon Kendra Benutzerdefinierte Anreicherung von Dokumenten.

Anmerkung

Jede Dokument-ID muss pro Index eindeutig sein. Sie können keine Datenquelle erstellen, um Ihre Dokumente eindeutig zu indizieren IDs und dann dieselben Dokumente BatchPutDocument API zu indizieren, oder umgekehrt. Sie können eine Datenquelle löschen und dann die verwenden BatchPutDocumentAPI, um dieselben Dokumente zu indizieren, oder umgekehrt. Verwenden Sie das BatchPutDocument und BatchDeleteDocument APIs in Kombination mit einem Amazon Kendra Ein Datenquellenkonnektor für denselben Satz von Dokumenten kann zu Inkonsistenzen mit Ihren Daten führen. Stattdessen empfehlen wir die Verwendung des Amazon Kendra benutzerdefinierter Datenquellen-Konnektor.

Anmerkung

Dem Index hinzugefügte Dateien müssen sich in einem UTF -8-Byte-Stream befinden. Weitere Informationen zu Dokumenten finden Sie in Amazon Kendra, siehe Dokumente.

Einen Aktualisierungszeitplan festlegen

Konfigurieren Sie Ihre Datenquelle so, dass sie regelmäßig mit der Konsole oder mithilfe des Schedule Parameters aktualisiert wird, wenn Sie eine Datenquelle erstellen oder aktualisieren. Der Inhalt des Parameters ist eine Zeichenfolge, die entweder eine Zeitplanzeichenfolge cron im -Format oder eine leere Zeichenfolge enthält, die angibt, dass der Index bei Bedarf aktualisiert wird. Informationen zum Format eines Cron-Ausdrucks finden Sie unter Schedule Expressions for Rules in der Amazon CloudWatch Events Benutzerleitfaden. Amazon Kendra unterstützt nur Cron-Ausdrücke. Es unterstützt keine Ratenausdrücke.

Eine Sprache einstellen

Sie können alle Ihre Dokumente in einer Datenquelle in einer unterstützten Sprache indizieren. Sie geben den Sprachcode für alle Ihre Dokumente in Ihrer Datenquelle an, wenn Sie anrufen CreateDataSource. Wenn für ein Dokument kein Sprachcode in einem Metadatenfeld angegeben ist, wird das Dokument mit dem Sprachcode indexiert, der für alle Dokumente auf Datenquellenebene angegeben ist. Wenn Sie keine Sprache angeben, Amazon Kendra indexiert Dokumente in einer Datenquelle standardmäßig auf Englisch. Weitere Informationen zu unterstützten Sprachen, einschließlich ihrer Codes, finden Sie unter Hinzufügen von Dokumenten in anderen Sprachen als Englisch.

Mithilfe der Konsole indizieren Sie alle Ihre Dokumente in einer Datenquelle in einer unterstützten Sprache. Gehen Sie zu Datenquellen und bearbeiten Sie Ihre Datenquelle oder Datenquelle hinzufügen, wenn Sie eine neue Datenquelle hinzufügen. Wählen Sie auf der Seite Datenquellendetails angeben eine Sprache aus der Dropdownliste Sprache aus. Sie wählen Aktualisieren oder geben weiterhin die Konfigurationsinformationen ein, um eine Verbindung zu Ihrer Datenquelle herzustellen.