Wählen Sie Ihre Cookie-Einstellungen aus

Wir verwenden essentielle Cookies und ähnliche Tools, die für die Bereitstellung unserer Website und Services erforderlich sind. Wir verwenden Performance-Cookies, um anonyme Statistiken zu sammeln, damit wir verstehen können, wie Kunden unsere Website nutzen, und Verbesserungen vornehmen können. Essentielle Cookies können nicht deaktiviert werden, aber Sie können auf „Anpassen“ oder „Ablehnen“ klicken, um Performance-Cookies abzulehnen.

Wenn Sie damit einverstanden sind, verwenden AWS und zugelassene Drittanbieter auch Cookies, um nützliche Features der Website bereitzustellen, Ihre Präferenzen zu speichern und relevante Inhalte, einschließlich relevanter Werbung, anzuzeigen. Um alle nicht notwendigen Cookies zu akzeptieren oder abzulehnen, klicken Sie auf „Akzeptieren“ oder „Ablehnen“. Um detailliertere Entscheidungen zu treffen, klicken Sie auf „Anpassen“.

Amazon S3 - Amazon Kendra

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Amazon S3

Amazon S3 ist ein Objektspeicherdienst, der Daten als Objekte in Buckets speichert. Sie können es verwenden Amazon Kendra , um Ihr Amazon S3 Bucket-Repository mit Dokumenten zu indizieren.

Warnung

Amazon Kendra verwendet keine Bucket-Richtlinie, die einem Amazon Kendra Principal die Erlaubnis erteilt, mit einem S3-Bucket zu interagieren. Stattdessen verwendet es IAM Rollen. Stellen Sie sicher, dass dies Amazon Kendra nicht als vertrauenswürdiges Mitglied in Ihrer Bucket-Richtlinie enthalten ist, um Datensicherheitsprobleme zu vermeiden, die durch die versehentliche Vergabe von Berechtigungen an beliebige Prinzipale entstehen. Sie können jedoch eine Bucket-Richtlinie hinzufügen, um einen Amazon S3 Bucket für verschiedene Konten zu verwenden. Weitere Informationen finden Sie unter Richtlinien zur Amazon S3 kontenübergreifenden Verwendung (auf der Registerkarte IAM S3-Rollen unter IAM Rollen für Datenquellen). Informationen zu IAM Rollen für S3-Datenquellen finden Sie unter IAM Rollen.

Anmerkung

Amazon Kendra unterstützt jetzt einen aktualisierten Amazon S3 Connector.

Die Konsole wurde automatisch für Sie aktualisiert. Alle neuen Konnektoren, die Sie in der Konsole erstellen, verwenden die aktualisierte Architektur. Wenn Sie die API verwenden, müssen Sie jetzt die TemplateConfigurationObjekt anstelle des S3DataSourceConfiguration Objekts zur Konfiguration Ihres Connectors.

Konnektoren, die mit der älteren Konsolen- und API-Architektur konfiguriert wurden, funktionieren weiterhin wie konfiguriert. Sie können sie jedoch nicht bearbeiten oder aktualisieren. Wenn Sie Ihre Connectorkonfiguration bearbeiten oder aktualisieren möchten, müssen Sie einen neuen Connector erstellen.

Wir empfehlen, Ihren Connector-Workflow auf die aktualisierte Version zu migrieren. Die Support für Konnektoren, die mit der älteren Architektur konfiguriert wurden, soll bis Juni 2024 eingestellt werden.

Sie können über die Amazon Kendra Konsole oder die TemplateConfigurationAPI eine Verbindung zu Ihrer Amazon S3 Datenquelle herstellen.

Anmerkung

Informationen zum Generieren eines Synchronisierungsstatusberichts für Ihre Amazon S3 Datenquelle finden Sie unter Problembehandlung bei Datenquellen.

Informationen zur Fehlerbehebung bei Ihrem Amazon Kendra S3-Datenquellen-Connector finden Sie unterProblembehandlung bei Datenquellen.

Unterstützte Features

  • Feldzuordnungen

  • Steuerung des Benutzerzugriffs

  • Einschluss-/Ausschlussfilter

  • Vollständige und inkrementelle Inhaltssynchronisierung

  • Virtual Private Cloud (VPC)

Voraussetzungen

Bevor Sie Ihre S3-Datenquelle Amazon Kendra zum Indizieren verwenden können, nehmen Sie diese Änderungen in Ihrem S3 und AWS Ihren Konten vor.

Stellen Sie in S3 sicher, dass Sie über Folgendes verfügen:

  • Der Name Ihres Amazon S3 Buckets wurde kopiert.

    Anmerkung

    Ihr Bucket muss sich in derselben Region wie Ihr Amazon Kendra Index befinden und Ihr Index muss berechtigt sein, auf den Bucket zuzugreifen, der Ihre Dokumente enthält.

  • Aktiviert, dass jedes Dokument in S3 und in anderen Datenquellen, die Sie für denselben Index verwenden möchten, einzigartig ist. Jede Datenquelle, die Sie für einen Index verwenden möchten, darf nicht dasselbe Dokument in allen Datenquellen enthalten. Dokumente IDs gelten für einen Index global und müssen für jeden Index eindeutig sein.

Stellen Sie in Ihrem AWS Konto sicher, dass Sie über Folgendes verfügen:

Wenn Sie noch keine IAM Rolle haben, können Sie die Konsole verwenden, um eine neue IAM Rolle zu erstellen, wenn Sie Ihre S3-Datenquelle mit verbinden Amazon Kendra. Wenn Sie die API verwenden, müssen Sie den ARN einer vorhandenen IAM Rolle und eine Index-ID angeben.

Anweisungen zur Verbindung

Um eine Verbindung Amazon Kendra zu Ihrer S3-Datenquelle herzustellen, müssen Sie die erforderlichen Details zu Ihrer S3-Datenquelle angeben, damit Sie auf Ihre Daten zugreifen Amazon Kendra können. Wenn Sie S3 noch nicht für konfiguriert haben Amazon Kendra, finden Sie weitere Informationen unterVoraussetzungen.

Console

Um eine Verbindung Amazon Kendra herzustellen Amazon S3

  1. Melden Sie sich bei der an AWS Management Console und öffnen Sie die Amazon Kendra Konsole.

  2. Wählen Sie im linken Navigationsbereich Indizes und dann den Index, den Sie verwenden möchten, aus der Indexliste aus.

    Anmerkung

    Sie können Ihre Einstellungen für die Benutzerzugriffskontrolle unter Indexeinstellungen konfigurieren oder bearbeiten.

  3. Wählen Sie auf der Seite Erste Schritte die Option Datenquelle hinzufügen aus.

  4. Wählen Sie auf der Seite Datenquelle hinzufügen die Option S3-Connector und dann Connector hinzufügen aus. Wenn Sie Version 2 verwenden (falls zutreffend), wählen Sie den S3-Connector mit dem Tag „V2.0".

  5. Geben Sie auf der Seite „Datenquellendetails angeben“ die folgenden Informationen ein:

    1. Geben Sie im Feld Name und Beschreibung für Datenquellenname einen Namen für Ihre Datenquelle ein. Sie können Bindestriche, aber keine Leerzeichen verwenden.

    2. (Optional) Beschreibung — Geben Sie eine optionale Beschreibung für Ihre Datenquelle ein.

    3. In Standardsprache — Wählen Sie eine Sprache aus, um Ihre Dokumente nach dem Index zu filtern. Sofern Sie nichts anderes angeben, ist die Standardsprache Englisch. Die in den Metadaten des Dokuments angegebene Sprache hat Vorrang vor der ausgewählten Sprache.

    4. Unter Tags für Neues Tag hinzufügen — Fügen Sie optionale Tags hinzu, um Ihre Ressourcen zu durchsuchen und zu filtern oder Ihre Kosten nachzuverfolgen. AWS

    5. Wählen Sie Weiter.

  6. Geben Sie auf der Seite Zugriff und Sicherheit definieren die folgenden optionalen Informationen ein:

    1. IAM Rolle — Wählen Sie eine bestehende IAM Rolle oder erstellen Sie eine neue IAM Rolle, um auf Ihre Repository-Anmeldeinformationen und Indexinhalte zuzugreifen.

      Anmerkung

      IAM Rollen, die für Indizes verwendet werden, können nicht für Datenquellen verwendet werden. Wenn Sie sich nicht sicher sind, ob eine vorhandene Rolle für einen Index oder eine häufig gestellte Frage verwendet wird, wählen Sie Neue Rolle erstellen, um Fehler zu vermeiden.

    2. Virtual Private Cloud (VPC) — Sie können wählen, ob Sie eine VPC verwenden möchten. In diesem Fall müssen Sie Subnetze und VPC-Sicherheitsgruppen hinzufügen.

    3. Wählen Sie Weiter.

  7. Geben Sie auf der Seite „Synchronisierungseinstellungen konfigurieren“ die folgenden Informationen ein:

    1. Für Speicherort der Datenquelle — Geben Sie den Pfad zu dem Amazon S3 Bucket an, in dem Ihre Daten gespeichert sind. Wählen Sie Browse S3 aus, um Ihren S3-Bucket auszuwählen.

    2. Für „Maximale Dateigröße“ — Geben Sie ein Limit in MB an, damit nur Dateien gecrawlt werden, die unter diesem Limit liegen. Die maximal zulässige Dateigröße Amazon Kendra beträgt 50 MB.

    3. Bei (optional) Metadatendateien mit Präfix zum Speicherort des Ordners — Geben Sie den Pfad zu dem Ordner an, in dem Ihre Felder/Attribute und andere Dokumentmetadaten gespeichert sind. Wählen Sie S3 durchsuchen aus, um Ihren Metadatenordner zu finden.

    4. Für (optional) Speicherort der Konfigurationsdatei für die Zugriffskontrollliste — Geben Sie den Pfad zu der Datei an, die eine JSON-Struktur Ihrer Benutzer und deren Zugriff auf Dokumente enthält. Wählen Sie „S3 durchsuchen“, um nach Ihrer ACL-Datei zu suchen.

    5. (Optional) Entschlüsselungsschlüssel wählen — Wählen Sie diese Option, um einen Entschlüsselungsschlüssel zu verwenden. Sie können wählen, ob Sie einen vorhandenen Schlüssel verwenden möchten. AWS KMS

    6. Für (optional) zusätzliche Konfiguration — Fügen Sie Muster hinzu, um bestimmte Dateien ein- oder auszuschließen. Alle Pfade beziehen sich auf den S3-Bucket mit dem Speicherort der Datenquelle.

    7. Synchronisierungsmodus — Wählen Sie aus, wie Sie Ihren Index aktualisieren möchten, wenn sich der Inhalt Ihrer Datenquelle ändert. Wenn Sie Ihre Datenquelle Amazon Kendra zum ersten Mal synchronisieren, werden alle Inhalte standardmäßig gecrawlt und indexiert. Sie müssen eine vollständige Synchronisierung Ihrer Daten durchführen, falls Ihre erste Synchronisierung fehlgeschlagen ist, auch wenn Sie die Option Vollsynchronisierung nicht als Synchronisierungsmodusoption wählen.

      • Vollständige Synchronisierung: Indizieren Sie den gesamten Inhalt neu und ersetzen die vorhandenen Inhalte jedes Mal, wenn Ihre Datenquelle mit Ihrem Index synchronisiert wird.

      • Neue, geänderte, gelöschte Synchronisierung: Indizieren Sie bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue, geänderte und gelöschte Inhalte. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.

    8. Wählen Sie im Zeitplan für die Synchronisierungsausführung unter Frequenz aus, wie oft der Inhalt Ihrer Datenquelle synchronisiert und der Index aktualisiert werden soll.

    9. Wählen Sie Weiter.

  8. Geben Sie auf der Seite Feldzuordnungen festlegen die folgenden optionalen Informationen ein:

    1. Standardfeldzuordnungen — Wählen Sie eines der Amazon Kendra generierten Standard-Datenquellenfelder aus, die Sie Ihrem Index zuordnen möchten.

    2. Feld hinzufügen — Wählen Sie diese Option, um benutzerdefinierte Datenquellenfelder hinzuzufügen, um einen Indexfeldnamen für die Zuordnung und den Felddatentyp zu erstellen.

    3. Wählen Sie Weiter.

  9. Überprüfen Sie auf der Seite Überprüfen und erstellen, ob die von Ihnen eingegebenen Informationen korrekt sind, und wählen Sie dann Datenquelle hinzufügen aus. Sie können Ihre Informationen auch auf dieser Seite bearbeiten. Ihre Datenquelle wird auf der Seite Datenquellen angezeigt, nachdem die Datenquelle erfolgreich hinzugefügt wurde.

API

Um eine Verbindung Amazon Kendra herzustellen Amazon S3

Sie müssen mithilfe der TemplateConfigurationAPI einen JSON-Wert des Datenquellenschemas angeben. Sie müssen die folgenden Informationen angeben:

  • Datenquelle — Geben Sie den Datenquellentyp an, wie S3 bei der Verwendung von TemplateConfigurationJSON-Schema. Geben Sie auch die Datenquelle anTEMPLATE, wie beim Aufrufen von CreateDataSourceAPI.

  • BucketName— Der Name des Buckets, der die Dokumente enthält.

  • Synchronisierungsmodus — Geben Sie an, wie Ihr Index aktualisiert Amazon Kendra werden soll, wenn sich der Inhalt Ihrer Datenquelle ändert. Wenn Sie Ihre Datenquelle Amazon Kendra zum ersten Mal synchronisieren, werden alle Inhalte standardmäßig gecrawlt und indexiert. Sie müssen eine vollständige Synchronisierung Ihrer Daten durchführen, falls Ihre erste Synchronisierung fehlgeschlagen ist, auch wenn Sie die Option Vollsynchronisierung nicht als Synchronisierungsmodusoption wählen. Sie können wählen zwischen:

    • FORCED_FULL_CRAWLum den gesamten Inhalt neu zu indizieren und vorhandene Inhalte jedes Mal zu ersetzen, wenn Ihre Datenquelle mit Ihrem Index synchronisiert wird.

    • FULL_CRAWLum bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue, geänderte und gelöschte Inhalte zu indizieren. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.

  • IAM Rolle — Geben Sie anRoleArn, wann Sie anrufenCreateDataSource, um einer IAM Rolle Berechtigungen für den Zugriff auf Ihr Secrets Manager geheimes Geheimnis und das Aufrufen der erforderlichen Öffentlichkeit APIs für den S3-Connector zu erteilen und Amazon Kendra. Weitere Informationen finden Sie unter IAM Rollen für S3-Datenquellen.

Sie können auch die folgenden optionalen Funktionen hinzufügen:

  • Virtual Private Cloud (VPC) — Geben Sie an, VpcConfiguration wann Sie anrufen. CreateDataSource Weitere Informationen finden Sie unter Konfiguration für Amazon Kendra die Verwendung eines Amazon VPC.

  • Inklusions- und Ausschlussfilter — Geben Sie an, ob bestimmte Dateinamen, Dateitypen und Dateipfade ein- oder ausgeschlossen werden sollen. Sie verwenden Glob-Muster (Muster, mit denen ein Platzhaltermuster zu einer Liste von Pfadnamen erweitert werden kann, die dem angegebenen Muster entsprechen). Beispiele finden Sie unter Verwendung von Ausschluss- und Include-Filtern in der AWS CLI-Befehlsreferenz.

  • Konfiguration von Dokumentmetadaten und Zugriffskontrolle — Fügen Sie Dokumentmetadaten und Zugriffskontrolldateien hinzu, die Informationen wie den Quell-URI, den Autor des Dokuments oder benutzerdefinierte Dokumentattribute/-felder sowie Ihre Benutzer und die Dokumente, auf die sie zugreifen können, enthalten. Jede Metadatendatei enthält Metadaten zu einem einzelnen Dokument.

  • Feldzuordnungen — Wählen Sie, ob Sie Ihre S3-Datenquellenfelder Ihren Indexfeldern zuordnen möchten. Amazon Kendra Weitere Informationen finden Sie unter Zuweisen von Datenquellenfeldern.

    Anmerkung

    Das Textfeld oder das entsprechende Textfeld für Ihre Dokumente ist erforderlich, um Ihre Dokumente durchsuchen Amazon Kendra zu können. Sie müssen den Feldnamen Ihres Dokumenthauptteils in Ihrer Datenquelle dem Namen des Indexfeldes zuordnen_document_body. Alle anderen Felder sind optional.

Eine Liste weiterer wichtiger JSON-Schlüssel, die konfiguriert werden müssen, finden Sie unter S3 Vorlagenschema.

Um eine Verbindung Amazon Kendra herzustellen Amazon S3

  1. Melden Sie sich bei der an AWS Management Console und öffnen Sie die Amazon Kendra Konsole.

  2. Wählen Sie im linken Navigationsbereich Indizes und dann den Index, den Sie verwenden möchten, aus der Indexliste aus.

    Anmerkung

    Sie können Ihre Einstellungen für die Benutzerzugriffskontrolle unter Indexeinstellungen konfigurieren oder bearbeiten.

  3. Wählen Sie auf der Seite Erste Schritte die Option Datenquelle hinzufügen aus.

  4. Wählen Sie auf der Seite Datenquelle hinzufügen die Option S3-Connector und dann Connector hinzufügen aus. Wenn Sie Version 2 verwenden (falls zutreffend), wählen Sie den S3-Connector mit dem Tag „V2.0".

  5. Geben Sie auf der Seite „Datenquellendetails angeben“ die folgenden Informationen ein:

    1. Geben Sie im Feld Name und Beschreibung für Datenquellenname einen Namen für Ihre Datenquelle ein. Sie können Bindestriche, aber keine Leerzeichen verwenden.

    2. (Optional) Beschreibung — Geben Sie eine optionale Beschreibung für Ihre Datenquelle ein.

    3. In Standardsprache — Wählen Sie eine Sprache aus, um Ihre Dokumente nach dem Index zu filtern. Sofern Sie nichts anderes angeben, ist die Standardsprache Englisch. Die in den Metadaten des Dokuments angegebene Sprache hat Vorrang vor der ausgewählten Sprache.

    4. Unter Tags für Neues Tag hinzufügen — Fügen Sie optionale Tags hinzu, um Ihre Ressourcen zu durchsuchen und zu filtern oder Ihre Kosten nachzuverfolgen. AWS

    5. Wählen Sie Weiter.

  6. Geben Sie auf der Seite Zugriff und Sicherheit definieren die folgenden optionalen Informationen ein:

    1. IAM Rolle — Wählen Sie eine bestehende IAM Rolle oder erstellen Sie eine neue IAM Rolle, um auf Ihre Repository-Anmeldeinformationen und Indexinhalte zuzugreifen.

      Anmerkung

      IAM Rollen, die für Indizes verwendet werden, können nicht für Datenquellen verwendet werden. Wenn Sie sich nicht sicher sind, ob eine vorhandene Rolle für einen Index oder eine häufig gestellte Frage verwendet wird, wählen Sie Neue Rolle erstellen, um Fehler zu vermeiden.

    2. Virtual Private Cloud (VPC) — Sie können wählen, ob Sie eine VPC verwenden möchten. In diesem Fall müssen Sie Subnetze und VPC-Sicherheitsgruppen hinzufügen.

    3. Wählen Sie Weiter.

  7. Geben Sie auf der Seite „Synchronisierungseinstellungen konfigurieren“ die folgenden Informationen ein:

    1. Für Speicherort der Datenquelle — Geben Sie den Pfad zu dem Amazon S3 Bucket an, in dem Ihre Daten gespeichert sind. Wählen Sie Browse S3 aus, um Ihren S3-Bucket auszuwählen.

    2. Für „Maximale Dateigröße“ — Geben Sie ein Limit in MB an, damit nur Dateien gecrawlt werden, die unter diesem Limit liegen. Die maximal zulässige Dateigröße Amazon Kendra beträgt 50 MB.

    3. Bei (optional) Metadatendateien mit Präfix zum Speicherort des Ordners — Geben Sie den Pfad zu dem Ordner an, in dem Ihre Felder/Attribute und andere Dokumentmetadaten gespeichert sind. Wählen Sie S3 durchsuchen aus, um Ihren Metadatenordner zu finden.

    4. Für (optional) Speicherort der Konfigurationsdatei für die Zugriffskontrollliste — Geben Sie den Pfad zu der Datei an, die eine JSON-Struktur Ihrer Benutzer und deren Zugriff auf Dokumente enthält. Wählen Sie „S3 durchsuchen“, um nach Ihrer ACL-Datei zu suchen.

    5. (Optional) Entschlüsselungsschlüssel wählen — Wählen Sie diese Option, um einen Entschlüsselungsschlüssel zu verwenden. Sie können wählen, ob Sie einen vorhandenen Schlüssel verwenden möchten. AWS KMS

    6. Für (optional) zusätzliche Konfiguration — Fügen Sie Muster hinzu, um bestimmte Dateien ein- oder auszuschließen. Alle Pfade beziehen sich auf den S3-Bucket mit dem Speicherort der Datenquelle.

    7. Synchronisierungsmodus — Wählen Sie aus, wie Sie Ihren Index aktualisieren möchten, wenn sich der Inhalt Ihrer Datenquelle ändert. Wenn Sie Ihre Datenquelle Amazon Kendra zum ersten Mal synchronisieren, werden alle Inhalte standardmäßig gecrawlt und indexiert. Sie müssen eine vollständige Synchronisierung Ihrer Daten durchführen, falls Ihre erste Synchronisierung fehlgeschlagen ist, auch wenn Sie die Option Vollsynchronisierung nicht als Synchronisierungsmodusoption wählen.

      • Vollständige Synchronisierung: Indizieren Sie den gesamten Inhalt neu und ersetzen die vorhandenen Inhalte jedes Mal, wenn Ihre Datenquelle mit Ihrem Index synchronisiert wird.

      • Neue, geänderte, gelöschte Synchronisierung: Indizieren Sie bei jeder Synchronisierung Ihrer Datenquelle mit Ihrem Index nur neue, geänderte und gelöschte Inhalte. Amazon Kendra kann den Mechanismus Ihrer Datenquelle verwenden, um Inhaltsänderungen nachzuverfolgen und Inhalte zu indexieren, die sich seit der letzten Synchronisierung geändert haben.

    8. Wählen Sie im Zeitplan für die Synchronisierungsausführung unter Frequenz aus, wie oft der Inhalt Ihrer Datenquelle synchronisiert und der Index aktualisiert werden soll.

    9. Wählen Sie Weiter.

  8. Geben Sie auf der Seite Feldzuordnungen festlegen die folgenden optionalen Informationen ein:

    1. Standardfeldzuordnungen — Wählen Sie eines der Amazon Kendra generierten Standard-Datenquellenfelder aus, die Sie Ihrem Index zuordnen möchten.

    2. Feld hinzufügen — Wählen Sie diese Option, um benutzerdefinierte Datenquellenfelder hinzuzufügen, um einen Indexfeldnamen für die Zuordnung und den Felddatentyp zu erstellen.

    3. Wählen Sie Weiter.

  9. Überprüfen Sie auf der Seite Überprüfen und erstellen, ob die von Ihnen eingegebenen Informationen korrekt sind, und wählen Sie dann Datenquelle hinzufügen aus. Sie können Ihre Informationen auch auf dieser Seite bearbeiten. Ihre Datenquelle wird auf der Seite Datenquellen angezeigt, nachdem die Datenquelle erfolgreich hinzugefügt wurde.

Weitere Informationen

Weitere Informationen zur Integration Amazon Kendra mit Ihrer S3-Datenquelle finden Sie unter:

DatenschutzNutzungsbedingungen für die WebsiteCookie-Einstellungen
© 2025, Amazon Web Services, Inc. oder Tochtergesellschaften. Alle Rechte vorbehalten.