Problembehandlung bei Datenquellen - Amazon Kendra

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Problembehandlung bei Datenquellen

Dieser Abschnitt kann Ihnen helfen, häufig auftretende Probleme bei der Konfiguration und Verwendung zu lösen Amazon Kendra Datenquellen-Konnektoren.

Meine Dokumente wurden nicht indexiert

Wenn Sie Ihre synchronisieren Amazon Kendra Beim Index mit einer Datenquelle können Probleme auftreten, die verhindern, dass die Dokumente indexiert werden. Die Indizierung erfolgt in zwei Schritten. Zunächst wird in der Datenquelle nach neuen und aktualisierten Dokumenten gesucht, die indexiert werden sollen, und nach Dokumenten, die aus dem Index entfernt werden sollen. Zweitens wird auf Dokumentebene auf jedes Dokument zugegriffen und es wird indexiert.

In jedem dieser Schritte kann ein Fehler auftreten. Fehler auf Datenquellenebene werden in der Konsole im Abschnitt Synchronisierungslaufverlauf der Datenquellendetailseite gemeldet. Der Status des Synchronisierungsauftrags kann „Erfolgreich“, „Unvollständig“ oder „Fehlgeschlagen“ lauten. Sie können auch die Anzahl der Dokumente sehen, die während des Jobs indexiert und gelöscht wurden. Wenn der Status Fehlgeschlagen lautet, wird in der Spalte Details eine Meldung angezeigt.

Fehler auf Dokumentebene werden in gemeldet Amazon CloudWatch Logs. Sie können die Fehler mit dem CloudWatch console.

Informationen zum Generieren eines Statusberichts zur Dokumentensynchronisierung finden Sie unter Ich möchte einen Synchronisierungsstatusbericht für meine Dokumente erstellen.

Mein Synchronisierungsauftrag ist fehlgeschlagen

Ein Synchronisationsjob schlägt normalerweise fehl, wenn ein Konfigurationsfehler im Index oder in der Datenquelle vorliegt. In der Konsole finden Sie die Fehlermeldung im Abschnitt Synchronisierungslaufverlauf der Datenquellendetails in der Spalte Details. Fehler auf Dokumentebene werden unter gemeldet Amazon CloudWatch Logs. Die Fehlermeldung gibt Auskunft darüber, was schief gelaufen ist. Das Problem besteht in der Regel darin, dass der Index oder die Datenquelle nicht über die richtigen IAM Berechtigungen. Die Fehlermeldung beschreibt die fehlenden Berechtigungen. Hier sind einige der Fehlermeldungen, die Sie erhalten können:

Failed to create log group for job. Please make sure that the IAM role provided has sufficient permissions.

Wenn Ihre Indexrolle keine Nutzungsberechtigung hat CloudWatch, wird die Datenquelle nicht in der Lage sein, eine zu erstellen CloudWatch Protokoll. Wenn Sie diesen Fehler erhalten, müssen Sie Folgendes hinzufügen CloudWatch Berechtigungen für die Indexrolle.

Failed to access Amazon S3 file prefix (bucket name) while trying to crawl your metadata files. Please make sure the IAM role (ARN) provided has sufficient permissions.

Wenn Sie eine verwenden Amazon S3 Datenquelle, Amazon Kendra muss berechtigt sein, auf den Bucket zuzugreifen, der die Dokumente enthält. Sie müssen die Erlaubnis hinzufügen für Amazon Kendra um den Bucket in die Datenquelle zu lesen IAM Rolle.

The provided IAM role (ARN) could not be assumed. Please make sure Amazon Kendra is a trusted entity that is allowed to assume the role.

Amazon Kendra benötigt die Erlaubnis, den Index und die Datenquelle zu übernehmen IAM Rollen. Sie müssen den Rollen, die für die sts:AssumeRole Aktion berechtigt sind, eine Vertrauensrichtlinie hinzufügen.

Für den IAM Richtlinien, die Amazon Kendra muss eine Datenquelle indizieren, siehe IAM Rollen.

Informationen zum Generieren eines Statusberichts zur Dokumentensynchronisierung finden Sie unter Ich möchte einen Synchronisierungsstatusbericht für meine Dokumente erstellen.

Mein Synchronisierungsauftrag ist unvollständig

Jobs sind in der Regel unvollständig, wenn sie den Prozess auf Datenquellenebene abgeschlossen haben, während des Prozesses auf Dokumentebene jedoch einige Fehler auftreten. Wenn ein Job unvollständig ist, wurden einige Dokumente möglicherweise nicht erfolgreich indexiert. Für ein Amazon S3 Bei einer Datenquelle wird ein unvollständiger Job in der Regel durch folgende Ursachen verursacht:

  • Die Metadaten für ein oder mehrere Dokumente waren ungültig.

  • Wenn Dokumente zur Indexierung eingereicht wurden, aber mindestens ein Dokument nicht eingereicht wurde.

  • Wenn Dokumente zum Löschen aus dem Index eingereicht wurden, aber mindestens ein Dokument nicht eingereicht wurde.

Um Probleme mit einem unvollständigen Synchronisierungsauftrag zu beheben, schauen Sie sich zunächst Ihre CloudWatch Protokolle.

  1. Wählen Sie in der Detailspalte die Option Details anzeigen in CloudWatch.

  2. Sehen Sie sich die Fehlermeldungen an, um herauszufinden, warum das Dokument nicht erfolgreich war.

Informationen zum Generieren eines Statusberichts zur Dokumentensynchronisierung finden Sie unter Ich möchte einen Synchronisierungsstatusbericht für meine Dokumente erstellen.

Mein Synchronisierungsauftrag war erfolgreich, aber es gibt keine indizierten Dokumente

Gelegentlich wird ein ausgeführter Indexsynchronisierungsauftrag als Erfolgreich markiert, aber es wurden keine neuen oder aktualisierten Dokumente zu dem erwarteten Zeitpunkt indexiert. Mögliche Gründe sind:

  • Check CloudWatch DocumentsSubmittedForIndexingFailedMetrik, um festzustellen, ob Dokumente nicht synchronisiert werden konnten. Prüfen Sie Ihre CloudWatch Einzelheiten finden Sie in den Protokollen.

  • Für ein Amazon S3 Datenquelle, die Sie möglicherweise angegeben haben Amazon Kendra der falsche Bucket-Name oder das falsche Präfix. Stellen Sie sicher, dass der Bucket Amazon Kendra wird verwendet, ist derjenige, der die zu indizierenden Dokumente enthält.

  • Bei der Neuindizierung eines Dokuments, das in einem früheren Job nicht indexiert werden konnte, Amazon Kendra indexiert es nur, wenn Sie das Dokument oder die zugehörige Metadatendatei geändert haben.

Informationen zum Generieren eines Statusberichts zur Dokumentensynchronisierung finden Sie unter Ich möchte einen Synchronisierungsstatusbericht für meine Dokumente erstellen.

Beim Synchronisieren meiner Datenquelle treten Probleme mit dem Dateiformat auf

Wenn Sie beim Hinzufügen von Dateien zu Ihrer Datenquelle oder beim Synchronisieren Ihrer Datenquelle auf Probleme mit dem Dateiformat stoßen, stellen Sie sicher, dass Ihre Dokumenttypen Amazon Kendra unterstützt. Für eine Liste der Dokumenttypen, die unterstützt werden von Amazon Kendra siehe Dokumenttypen oder -formate.

Wenn Sie das BatchPutDocument API mit Nur-Text-Dateien verwenden, geben Sie PLAIN_TEXT als Inhaltstyp an.

Ich möchte einen Synchronisierungsverlaufsbericht für meine Dokumente erstellen

Sie können einen Bericht zum Synchronisierungsverlauf auf Dokumentebene CloudWatch für Ihren Datenquellensynchronisierungsauftrag anzeigen, indem Sie Bericht anzeigen auswählen. Ein Bericht über den Verlauf der Synchronisation enthält Einzelheiten zum Fortschritt und Status der einzelnen Dokumente im Synchronisierungsauftrag. Er zeigt an, ob ein Dokument während der Crawl-, Synchronisierungs- und Indexierungsphase erfolgreich war, fehlgeschlagen ist oder ob es übersprungen wurde. Sie finden dort auch alle Fehlermeldungen, die sich auf fehlgeschlagene oder übersprungene Dokumente beziehen. Wenn der Bericht keine Ergebnisse für einen laufenden Synchronisierungsauftrag anzeigt, sind die Protokolle möglicherweise noch nicht verfügbar. Schauen Sie später noch einmal vorbei, da Daten an den Bericht gesendet werden, wenn während des Synchronisierungsvorgangs Ereignisse auftreten.

Gehen Sie wie folgt vor, um auf Ihren Bericht zum Verlauf der Synchronisierungsläufe zuzugreifen:

  1. Öffnen Sie die Amazon Kendra Kendra-Konsole unter https://console.aws.amazon.com/kendra/.

  2. Wählen Sie im linken Navigationsmenü unter Datenverwaltung die Option Datenquellen und dann Ihre Datenquelle aus.

  3. Scrollen Sie auf der Übersichtsseite der Datenquelle nach unten und wählen Sie den Tab Synchronisierungsverlauf aus.

  4. Wählen Sie unter Synchronisierungslaufverlauf die Option Aktionen aus.

  5. Wählen Sie unter Aktionen die Option Bericht anzeigen aus. Sie werden zur CloudWatch Konsole weitergeleitet, über die Sie auf Ihren Bericht zugreifen können.

Anmerkung

Ein Synchronisierungslaufverlauf zeichnet für alle von Amazon Kendra unterstützten Connectoren auf, ob ein Dokument während der Aufnahme erfolgreich indexiert wurde, einschließlich angehängter Dokumente ACLs und Metadaten.

Wenn Sie den Amazon S3 S3-Connector verwenden:

Zusätzlich zur Anzeige des Synchronisierungsverlaufs auf Dokumentebene in CloudWatch können Sie Synchronisierungsverlaufsberichte für jedes Dokument in Ihrer Amazon S3 S3-Datenquelle erstellen und diese in ein Amazon S3 Eimer. Während dieses Vorgangs werden Ihre Daten verschlüsselt mit AWS KMS Schlüssel und können nur von Ihnen eingesehen werden. Der Status des gemeldeten Dokuments kann einer der folgenden sein: Fehlgeschlagen, Abgeschlossen oder Erfolgreich mit Fehlern. Bevor Sie Synchronisierungsstatusberichte für Amazon S3 erstellen können, müssen Sie wie folgt vorgehen:

  • Fügen Sie Folgendes hinzu Amazon Kendra Service Principal zu Ihrem Amazon S3 Zugriffsrichtlinie

    { “Version”: “2012-10-17", “Statement”: [ { “Sid”: “KendraS3Access”, “Effect”: “Allow”, “Principal”: { “Service”: “kendra.amazonaws.com” }, “Action”: “s3:PutObject”, “Resource”: “arn:aws:s3:::your-manifest-bucket-name/*” } ] }
  • Erstellen Sie ein Amazon S3 Bucket mit Zugriffsberechtigungen für Amazon Kendra

Wenn Sie die Konsole verwenden, um einen Synchronisierungsverlaufsbericht für Amazon S3 zu generieren, aktivieren Sie auf der Seite mit den Datenquellendetails im Abschnitt Synchronisierungsverlaufsberichte — optional die Option Berichte generieren. Geben Sie dann den Amazon S3 Bucket-Standort und wählen Sie aus den verfügbaren Konfigurationsoptionen. Berichte werden bei der nächsten Synchronisierung generiert, nachdem Sie die Option Bericht generieren aktiviert haben.

Wenn Sie das löschen Amazon S3 Bucket, Sie verlieren Ihre Protokolldaten und müssen einen neuen Bucket einrichten, um neue Synchronisierungsberichte zu speichern.

Anmerkung

Ein Synchronisierungsverlaufsbericht enthält nur Informationen darüber, ob ein Amazon S3 S3-Connector erfolgreich Daten gecrawlt und aufgenommen hat.

Wie viel Zeit nimmt das Synchronisieren einer Datenquelle in Anspruch?

Wenn es keine Aktualisierungen an Dokumenten gibt, synchronisieren Sie die Zeit für Amazon Kendra Der Index nimmt linear proportional zur Anzahl der Dokumente zu. Beispielsweise würde die Synchronisierung von 1.000 Dokumenten ohne Aktualisierungen etwa fünf Minuten und die Synchronisierung von 2.000 Dokumenten ohne Aktualisierungen etwa 10 Minuten dauern. Wenn die Dokumente aktualisiert werden, erhöht sich die Synchronisierungszeit je nach Anzahl der aktualisierten Dokumente.

Wie hoch sind die Gebühren für die Synchronisierung einer Datenquelle?

Wenn Sie Ihren Index synchronisieren, dauert das Aufwärmen und Aktivieren zwei Minuten Amazon EC2 um die notwendigen Verbindungen herzustellen. Während dieses Vorgangs werden Ihnen keine Gebühren berechnet. Ihr Nutzungszähler beginnt erst, nachdem der Synchronisierungsjob gestartet wurde. Weitere Informationen zu Amazon Kendra Preisgestaltung, siehe Amazon Kendra Preisgestaltung .

Ich erhalte eine Amazon EC2 Autorisierungsfehler

Wenn ein Amazon EC2 Während einer Synchronisierung für eine Virtual Private Cloud (VPC) -Datenquelle tritt ein Fehler bei einem nicht autorisierten Vorgang auf, ist es wahrscheinlich, dass VPC IAM Für diese Rolle fehlen die erforderlichen Berechtigungen. Bitte überprüfen Sie, ob IAM Die Rolle, die Sie für Ihre Datenquelle verwenden, hat die zugehörigen Berechtigungen. Weitere Informationen finden Sie unter Virtuelle private Cloud IAM Rolle.

Ihre Amazon Kendra Der Index kann nur auf Dateien zugreifen, die Amazon S3 Eine Datenquelle gewährt ihm Zugriffsberechtigungen. Zum Beispiel Amazon Kendra kann das nicht ändern Amazon S3 Berechtigungen, die bestimmen, ob ein Objekt öffentlich oder verschlüsselt sein soll. Amazon Kendra verfügt auch nicht über die Standardberechtigungen zum Erstellen oder Zurücksenden eines signierten Links für Amazon S3 Objekte. Wenn Sie signiertes Verlinken aktivieren möchten für Amazon S3 Objekte in einem Amazon Kendra Index, Sie haben zwei Möglichkeiten:

  • Sie können Ihre Indexabfrageergebnisse mit dem Quell-URI-Objekt signieren, bevor Sie das Ergebnis an die Suchseite zurückgeben. Eine step-by-step exemplarische Vorgehensweise für diesen Vorgang finden Sie unter Objekte mit URLs presigned gemeinsam nutzen.

  • Sie können das überschreiben Amazon S3 Quell-URI für Objektmetadaten und Ihren Dienst über einen verfügbar machen CloudFront Content Delivery Network (CDN), verbunden mit einem Amazon S3 Eimer. Oder Sie können eine verwenden API Gateway Proxy-Endpunkt, der ein vorsigniertes Objekt zurückgibt URL und zu diesem weiterleitet.

Ich erhalte die Fehlermeldung „AccessDenied Bei Verwendung der SSL Zertifikatsdatei

Wenn Sie bei der Verwendung eines SSL Zertifikats mit Ihrer Datenquelle die Fehlermeldung „Zugriff verweigert“ erhalten, stellen Sie sicher, dass IAM Die Rolle hat die Berechtigung, auf die SSL Zertifikatsdatei am angegebenen Speicherort zuzugreifen. Wenn das Zertifikat verschlüsselt ist mit einem AWS KMS Schlüssel, dein IAM Die Rolle sollte auch die Erlaubnis haben, mit dem zu entschlüsseln AWS KMS Schlüssel. Weitere Informationen finden Sie unter Authentifizierung und Zugriffskontrolle für AWS KMS.

Ich erhalte einen Autorisierungsfehler, wenn ich eine SharePoint Datenquelle verwende

Wenn Sie beim Synchronisieren Ihres Indexes mit einer SharePoint Datenquelle einen Autorisierungsfehler erhalten, vergewissern Sie sich, dass Ihnen eine Site-Administrator-Rolle zugewiesen wurde. SharePoint

Mein Index crawlt keine Dokumente aus meiner Confluence-Datenquelle

Wenn Ihre Amazon Kendra Der Index crawlt während des Synchronisierungsvorgangs keine Dokumente aus Ihrer Confluence-Datenquelle. Vergewissern Sie sich, dass Sie Teil der Administratorgruppen in Confluence sind.