Problembehandlung bei Datenquellen - Amazon Kendra

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Problembehandlung bei Datenquellen

Dieser Abschnitt kann Ihnen helfen, häufig auftretende Probleme bei der Konfiguration und Verwendung von Amazon Kendra Datenquellenconnectors zu lösen.

Meine Dokumente wurden nicht indexiert

Wenn Sie Ihren Amazon Kendra Index mit einer Datenquelle synchronisieren, können Probleme auftreten, die verhindern, dass die Dokumente indexiert werden. Die Indizierung erfolgt in zwei Schritten. Zunächst wird in der Datenquelle nach neuen und aktualisierten Dokumenten gesucht, die indexiert werden sollen, und nach Dokumenten, die aus dem Index entfernt werden sollen. Zweitens wird auf Dokumentebene auf jedes Dokument zugegriffen und es wird indexiert.

In jedem dieser Schritte kann ein Fehler auftreten. Fehler auf Datenquellenebene werden in der Konsole im Abschnitt Synchronisierungslaufverlauf der Datenquellendetailseite gemeldet. Der Status des Synchronisierungsauftrags kann „Erfolgreich“, „Unvollständig“ oder „Fehlgeschlagen“ lauten. Sie können auch die Anzahl der Dokumente sehen, die während des Jobs indexiert und gelöscht wurden. Wenn der Status Fehlgeschlagen lautet, wird in der Spalte Details eine Meldung angezeigt.

Fehler auf Dokumentebene werden in gemeldet Amazon CloudWatch Logs. Sie können sich die Fehler in der CloudWatch Konsole ansehen.

Informationen zum Generieren eines Statusberichts zur Dokumentensynchronisierung finden Sie unter Ich möchte einen Synchronisierungsstatusbericht für meine Dokumente erstellen.

Mein Synchronisierungsauftrag ist fehlgeschlagen

Ein Synchronisierungsauftrag schlägt normalerweise fehl, wenn ein Konfigurationsfehler im Index oder in der Datenquelle vorliegt. In der Konsole finden Sie die Fehlermeldung im Abschnitt Synchronisierungslaufverlauf der Datenquellendetails in der Spalte Details. Fehler auf Dokumentebene werden unter gemeldet Amazon CloudWatch Logs. Die Fehlermeldung gibt Aufschluss darüber, was schief gelaufen ist. Das Problem besteht normalerweise darin, dass der Index oder die Datenquelle nicht über die richtigen IAM Berechtigungen verfügt. Die Fehlermeldung beschreibt die fehlenden Berechtigungen. Hier sind einige der Fehlermeldungen, die Sie erhalten können:

Failed to create log group for job. Please make sure that the IAM role provided has sufficient permissions.

Wenn Ihre Indexrolle keine Nutzungsberechtigung hat CloudWatch, kann die Datenquelle kein CloudWatch Protokoll erstellen. Wenn Sie diesen Fehler erhalten, müssen Sie der Indexrolle CloudWatch Berechtigungen hinzufügen.

Failed to access Amazon S3 file prefix (bucket name) while trying to crawl your metadata files. Please make sure the IAM role (ARN) provided has sufficient permissions.

Wenn Sie eine Amazon S3 Datenquelle verwenden, Amazon Kendra müssen Sie berechtigt sein, auf den Bucket zuzugreifen, der die Dokumente enthält. Sie müssen der IAM Datenquellenrolle die Berechtigung Amazon Kendra zum Lesen des Buckets hinzufügen.

The provided IAM role (ARN) could not be assumed. Please make sure Amazon Kendra is a trusted entity that is allowed to assume the role.

Amazon Kendra benötigt die Erlaubnis, die Index- und IAM Datenquellenrollen zu übernehmen. Sie müssen den Rollen, die für die sts:AssumeRole Aktion berechtigt sind, eine Vertrauensrichtlinie hinzufügen.

Die IAM Richtlinien, die eine Datenquelle indizieren Amazon Kendra müssen, finden Sie unter IAM Rollen.

Informationen zum Generieren eines Statusberichts zur Dokumentensynchronisierung finden Sie unter Ich möchte einen Synchronisierungsstatusbericht für meine Dokumente erstellen.

Mein Synchronisierungsauftrag ist unvollständig

Jobs sind in der Regel unvollständig, wenn sie den Prozess auf Datenquellenebene abgeschlossen haben, während des Prozesses auf Dokumentebene jedoch einige Fehler auftreten. Wenn ein Job unvollständig ist, wurden einige Dokumente möglicherweise nicht erfolgreich indexiert. Bei einer Amazon S3 Datenquelle wird ein unvollständiger Job in der Regel durch folgende Ursachen verursacht:

  • Die Metadaten für ein oder mehrere Dokumente waren ungültig.

  • Wenn Dokumente zur Indexierung eingereicht wurden, aber mindestens ein Dokument nicht eingereicht wurde.

  • Wenn Dokumente zum Löschen aus dem Index eingereicht wurden, aber mindestens ein Dokument nicht eingereicht wurde.

Um Fehler bei einer unvollständigen Synchronisation zu beheben, schauen Sie sich zunächst Ihre CloudWatch Logs an.

  1. Wählen Sie in der Detailspalte die Option Details anzeigen in aus CloudWatch.

  2. Sehen Sie sich die Fehlermeldungen an, um herauszufinden, warum das Dokument nicht erfolgreich war.

Informationen zum Generieren eines Statusberichts zur Dokumentensynchronisierung finden Sie unter Ich möchte einen Synchronisierungsstatusbericht für meine Dokumente erstellen.

Mein Synchronisierungsauftrag war erfolgreich, aber es gibt keine indizierten Dokumente

Gelegentlich wird ein ausgeführter Indexsynchronisierungsauftrag als Erfolgreich markiert, aber es wurden keine neuen oder aktualisierten Dokumente zu dem erwarteten Zeitpunkt indexiert. Mögliche Gründe sind:

  • Überprüfen Sie die CloudWatch DocumentsSubmittedForIndexingFailed Metrik, um festzustellen, ob Dokumente nicht synchronisiert werden konnten. Einzelheiten finden Sie in Ihren CloudWatch Protokollen.

  • Für eine Amazon S3 Datenquelle haben Sie möglicherweise Amazon Kendra den falschen Bucket-Namen oder das falsche Präfix angegeben. Stellen Sie sicher, dass der Bucket, der verwendet Amazon Kendra wird, derjenige ist, der die zu indizierenden Dokumente enthält.

  • Wenn Sie ein Dokument erneut indizieren, das in einem früheren Job nicht indexiert werden konnte, Amazon Kendra wird es nur indexiert, wenn Sie das Dokument oder die zugehörige Metadatendatei geändert haben.

Informationen zum Generieren eines Statusberichts zur Dokumentensynchronisierung finden Sie unter Ich möchte einen Synchronisierungsstatusbericht für meine Dokumente erstellen.

Beim Synchronisieren meiner Datenquelle treten Probleme mit dem Dateiformat auf

Wenn Sie beim Hinzufügen von Dateien zu Ihrer Datenquelle oder beim Synchronisieren Ihrer Datenquelle auf Probleme mit dem Dateiformat stoßen, stellen Sie sicher, dass Ihre Dokumenttypen unterstützt werden Amazon Kendra . Eine Liste der von unterstützten Dokumenttypen Amazon Kendra finden Sie unter Dokumenttypen oder Formate.

Wenn Sie die BatchPutDocument API mit Nur-Text-Dateien verwenden, geben Sie PLAIN_TEXT als Inhaltstyp an.

Ich möchte einen Synchronisierungsverlaufsbericht für meine Dokumente erstellen

Sie können einen Bericht zum Synchronisierungsverlauf auf Dokumentebene CloudWatch für Ihren Datenquellensynchronisierungsauftrag anzeigen, indem Sie Bericht anzeigen auswählen. Ein Bericht über den Verlauf der Synchronisation enthält Einzelheiten zum Fortschritt und Status der einzelnen Dokumente im Synchronisierungsauftrag. Er zeigt an, ob ein Dokument während der Crawl-, Synchronisierungs- und Indexierungsphase erfolgreich war, fehlgeschlagen ist oder ob es übersprungen wurde. Sie finden dort auch alle Fehlermeldungen, die sich auf fehlgeschlagene oder übersprungene Dokumente beziehen. Wenn der Bericht keine Ergebnisse für einen laufenden Synchronisierungsauftrag anzeigt, sind die Protokolle möglicherweise noch nicht verfügbar. Schauen Sie später noch einmal vorbei, da Daten an den Bericht gesendet werden, wenn während des Synchronisierungsvorgangs Ereignisse auftreten.

Gehen Sie wie folgt vor, um auf Ihren Bericht zum Verlauf der Synchronisierungsläufe zuzugreifen:

  1. Öffnen Sie die Amazon Kendra Kendra-Konsole unter https://console.aws.amazon.com/kendra/.

  2. Wählen Sie im linken Navigationsmenü unter Datenverwaltung die Option Datenquellen und dann Ihre Datenquelle aus.

  3. Scrollen Sie auf der Übersichtsseite der Datenquelle nach unten und wählen Sie den Tab Synchronisierungsverlauf aus.

  4. Wählen Sie unter Synchronisierungslaufverlauf die Option Aktionen aus.

  5. Wählen Sie unter Aktionen die Option Bericht anzeigen aus. Sie werden zur CloudWatch Konsole weitergeleitet, über die Sie auf Ihren Bericht zugreifen können.

Anmerkung

Ein Synchronisierungslaufverlauf zeichnet für alle von Amazon Kendra unterstützten Konnektoren auf, ob ein Dokument während der Aufnahme erfolgreich indexiert wurde, einschließlich angehängter Dokumente ACLs und Metadaten.

Wenn Sie den Amazon S3 S3-Connector verwenden:

Zusätzlich zur Anzeige des Synchronisierungsverlaufs auf Dokumentebene in CloudWatch können Sie Synchronisierungsverlaufsberichte für jedes Dokument in Ihrer Amazon S3 S3-Datenquelle erstellen und in einen Bucket kopieren. Amazon S3 Während dieses Vorgangs werden Ihre Daten mithilfe von AWS KMS Schlüsseln verschlüsselt und können nur von Ihnen eingesehen werden. Der Status des gemeldeten Dokuments kann einer der folgenden sein: Fehlgeschlagen, Abgeschlossen oder Erfolgreich mit Fehlern. Bevor Sie Synchronisierungsstatusberichte für Amazon S3 erstellen können, müssen Sie wie folgt vorgehen:

  • Fügen Sie Ihrer Amazon S3 Zugriffsrichtlinie den folgenden Amazon Kendra Service Principal hinzu

    { “Version”: “2012-10-17", “Statement”: [ { “Sid”: “KendraS3Access”, “Effect”: “Allow”, “Principal”: { “Service”: “kendra.amazonaws.com” }, “Action”: “s3:PutObject”, “Resource”: “arn:aws:s3:::your-manifest-bucket-name/*” } ] }
  • Erstellen Sie einen Amazon S3 Bucket mit Zugriffsberechtigungen für Amazon Kendra

Wenn Sie die Konsole verwenden, um einen Synchronisierungsverlaufsbericht für Amazon S3 zu generieren, aktivieren Sie auf der Seite mit den Datenquellendetails im Abschnitt Synchronisierungsverlaufsberichte — optional die Option Berichte generieren. Geben Sie dann den Amazon S3 Bucket-Standort ein und wählen Sie aus den verfügbaren Konfigurationsoptionen. Berichte werden bei der nächsten Synchronisierung generiert, nachdem Sie die Option Bericht generieren aktiviert haben.

Wenn Sie den Amazon S3 Bucket löschen, verlieren Sie Ihre Protokolldaten und müssen einen neuen Bucket einrichten, um neue Synchronisierungsberichte zu speichern.

Anmerkung

Ein Synchronisierungsverlaufsbericht enthält nur Informationen darüber, ob ein Amazon S3 S3-Connector erfolgreich Daten gecrawlt und aufgenommen hat.

Wie viel Zeit nimmt das Synchronisieren einer Datenquelle in Anspruch?

Wenn Dokumente nicht aktualisiert werden, erhöht sich die Synchronisierungszeit für einen Amazon Kendra Index linear proportional zur Anzahl der Dokumente. Beispielsweise würde die Synchronisierung von 1.000 Dokumenten ohne Aktualisierungen etwa fünf Minuten dauern, und bei 2.000 Dokumenten ohne Aktualisierungen etwa 10 Minuten. Wenn die Dokumente aktualisiert werden, erhöht sich die Synchronisierungszeit je nach Anzahl der aktualisierten Dokumente.

Wie hoch sind die Gebühren für die Synchronisierung einer Datenquelle?

Wenn Sie Ihren Index synchronisieren, dauert das Aufwärmen und Aktivieren zwei Minuten Amazon EC2 , um die erforderlichen Verbindungen herzustellen. Während dieses Vorgangs werden Ihnen keine Gebühren berechnet. Ihr Nutzungszähler beginnt erst, nachdem der Synchronisierungsjob gestartet wurde. Weitere Informationen zur Amazon Kendra Preisgestaltung finden Sie unter Amazon Kendra Preise.

Ich erhalte einen Amazon EC2 Autorisierungsfehler

Wenn während einer Synchronisierung für eine Virtual Private Cloud (VPC) -Datenquelle ein Fehler bei einem Amazon EC2 nicht autorisierten Vorgang auftritt, fehlen Ihrer IAM VPC-Rolle wahrscheinlich die erforderlichen Berechtigungen. Bitte überprüfen Sie, ob die IAM Rolle, die Sie für Ihre Datenquelle verwenden, über die entsprechenden Berechtigungen verfügt. Weitere Informationen finden Sie unter IAM Rolle „Virtuelle private Cloud“.

Ihr Amazon Kendra Index kann nur auf Dateien zugreifen, für die ihm eine Amazon S3 Datenquelle Zugriffsberechtigungen erteilt. Beispielsweise Amazon Kendra können die Amazon S3 Berechtigungen, die festlegen, ob ein Objekt öffentlich oder verschlüsselt sein soll, nicht geändert werden. Amazon Kendra verfügt auch nicht über die Standardberechtigungen, um einen signierten Link für Amazon S3 Objekte zu erstellen oder zurückzugeben. Wenn Sie signierte Verknüpfungen für Amazon S3 Objekte in einem Amazon Kendra Index aktivieren möchten, haben Sie zwei Möglichkeiten:

  • Sie können Ihre Indexabfrageergebnisse mit dem Quell-URI-Objekt signieren, bevor Sie das Ergebnis an die Suchseite zurückgeben. Eine step-by-step exemplarische Vorgehensweise für diesen Vorgang finden Sie unter Objekte mit URLs presigned gemeinsam nutzen.

  • Sie können den Quell-URI der Amazon S3 Objektmetadaten überschreiben und Ihren Service über ein CloudFront Content Delivery Network (CDN) verfügbar machen, das mit einem Bucket verbunden ist. Amazon S3 Sie können auch einen API Gateway Proxy-Endpunkt verwenden, der eine vorsignierte URL zurückgibt und zu dieser weiterleitet.

Ich erhalte eine Fehlermeldung AccessDenied bei Verwendung der SSL-Zertifikatsdatei

Wenn Sie bei der Verwendung eines SSL-Zertifikats mit Ihrer Datenquelle die Fehlermeldung „Zugriff verweigert“ erhalten, stellen Sie sicher, dass Ihre IAM Rolle berechtigt ist, auf die SSL-Zertifikatsdatei am angegebenen Speicherort zuzugreifen. Wenn das Zertifikat mit einem AWS KMS Schlüssel verschlüsselt ist, sollte Ihre IAM Rolle auch die Berechtigung haben, es mithilfe des AWS KMS Schlüssels zu entschlüsseln. Weitere Informationen finden Sie unter Authentifizierung und Zugriffskontrolle für AWS KMS.

Ich erhalte einen Autorisierungsfehler, wenn ich eine SharePoint Datenquelle verwende

Wenn Sie beim Synchronisieren Ihres Indexes mit einer SharePoint Datenquelle einen Autorisierungsfehler erhalten, vergewissern Sie sich, dass Ihnen eine Site-Administrator-Rolle zugewiesen wurde. SharePoint

Mein Index crawlt keine Dokumente aus meiner Confluence-Datenquelle

Wenn dein Amazon Kendra Index während des Synchronisierungsvorgangs keine Dokumente aus deiner Confluence-Datenquelle crawlt, vergewissere dich, dass du Teil der Administratorgruppen in Confluence bist.