Überwachung von Amazon Kendra mit Amazon Logs CloudWatch - Amazon Kendra

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überwachung von Amazon Kendra mit Amazon Logs CloudWatch

Amazon Kendra verwendet Amazon CloudWatch Logs, um Ihnen einen Einblick in den Betrieb Ihrer Datenquellen zu geben. Amazon Kendra protokolliert Prozessdetails für die Dokumente, während sie indexiert werden. Es protokolliert Fehler aus Ihrer Datenquelle, die während der Indexierung Ihrer Dokumente auftreten. Sie verwenden CloudWatch Logs, um die Protokolldateien zu überwachen, zu speichern und darauf zuzugreifen.

CloudWatch Logs speichert Protokollereignisse in einem Protokollstream, der Teil einer Protokollgruppe ist. Amazon Kendra verwendet diese Funktionen wie folgt:

  • Protokollgruppen — Amazon Kendra speichert alle Ihre Protokollstreams in einer einzigen Protokollgruppe für jeden Index. Amazon Kendra erstellt die Protokollgruppe, wenn der Index erstellt wird. Die Protokollgruppen-ID beginnt immer mit „aws/kendra/“.

  • Protokollstream — Amazon Kendra erstellt einen neuen Datenquellen-Protokollstream in der Protokollgruppe für jeden Indexsynchronisierungsauftrag, den Sie ausführen. Es erstellt auch einen neuen Dokument-Log-Stream, wenn ein Stream ungefähr 500 Einträge erreicht.

  • Protokolleinträge — Amazon Kendra erstellt bei der Indizierung von Dokumenten einen Protokolleintrag im Protokollstream. Jeder Eintrag enthält Informationen über die Verarbeitung des Dokuments oder über aufgetretene Fehler.

Weitere Informationen zur Verwendung von CloudWatch Logs finden Sie unter Was ist Amazon Cloud Watch Logs im Amazon Cloud Watch Logs-Benutzerhandbuch.

Amazon Kendra erstellt zwei Arten von Protokollstreams:

Datenquellen-Logstreams

Datenquellen-Logstreams veröffentlichen Einträge zu Ihren Indexsynchronisierungsjobs. Jeder Synchronisierungsauftrag erstellt einen neuen Protokollstream, der zum Veröffentlichen von Einträgen verwendet wird. Der Name des Protokolldatenstroms lautet:

data source id/YYYY-MM-DD-HH/data source sync job ID

Für jeden ausgeführten Synchronisationsauftrag wird ein neuer Protokollstream erstellt.

Es gibt drei Arten von Protokollnachrichten, die in einem Datenquellen-Logstream veröffentlicht werden:

  • Eine Protokollnachricht für ein Dokument, das nicht zur Indizierung gesendet werden konnte. Im Folgenden finden Sie ein Beispiel für diese Nachricht für ein Dokument in einer S3-Datenquelle:

    { "DocumentId": "document ID", "S3Path": "s3://bucket/prefix/object", "Message": "Failed to ingest document via BatchPutDocument.", "ErrorCode": "InvalidRequest", "ErrorMessage": "No document metadata configuration found for document attribute key city." }
  • Eine Protokollnachricht für ein Dokument, das nicht zum Löschen gesendet werden konnte. Im Folgenden finden Sie ein Beispiel für diese Nachricht:

    { "DocumentId": "document ID", "Message": "Failed to delete document via BatchDeleteDocument.", "ErrorCode": "InvalidRequest", "ErrorMessage": "Document can't be deleted because it doesn't exist." }
  • Eine Protokollmeldung, wenn eine ungültige Metadatendatei für ein Dokument in einem Amazon S3 S3-Bucket gefunden wird. Das Folgende ist ein Beispiel für diese Nachricht.

    { "Message": "Found invalid metadata file bucket/prefix/filename.extension.metadata.json." }
  • Für SharePoint und Datenbank-Konnektoren schreibt Amazon Kendra nur dann Nachrichten in den Protokollstream, wenn ein Dokument nicht indexiert werden kann. Das Folgende ist ein Beispiel für die Fehlermeldung, die Amazon Kendra protokolliert.

    { "DocumentID": "document ID", "IndexID": "index ID", "SourceURI": "", "CrawlStatus": "FAILED", "ErrorCode": "403", "ErrorMessage": "Access Denied", "DataSourceErrorCode": "403" }

Dokumentieren Sie Protokollstreams

Amazon Kendra protokolliert Informationen über die Verarbeitung von Dokumenten, während sie indexiert werden. Es protokolliert eine Reihe von Nachrichten für Dokumente, die in einer Amazon S3 S3-Datenquelle gespeichert sind. Es protokolliert Fehler nur für Dokumente, die in einer Microsoft SharePoint - oder einer Datenbankdatenquelle gespeichert sind.

Wenn die Dokumente mithilfe des BatchPutDocumentVorgangs zum Index hinzugefügt wurden, wird der Protokollstream wie folgt benannt:

YYYY-MM-DD-HH/UUID

Wenn die Dokumente mithilfe einer Datenquelle zum Index hinzugefügt wurden, wird der Protokollstream wie folgt benannt:

dataSourceId/YYYY-MM-DD-HH/UUID

Jeder Protokollstream enthält bis zu 500 Nachrichten.

Wenn die Indizierung eines Dokuments fehlschlägt, wird diese Meldung in den Protokollstream ausgegeben:

{ "DocumentId": "document ID", "IndexName": "index name", "IndexId": "index ID" "SourceURI": "source URI" "IndexingStatus": "DocumentFailedToIndex", "ErrorCode": "400 | 500", "ErrorMessage": "message" }

Amazon Kendra-Metriken für Ihre Synchronisierungsjobs anzeigen

Sie können einen Bericht über den Verlauf der Synchronisierungsläufe auf Dokumentebene CloudWatch für Ihren Datenquellen-Synchronisierungsauftrag anzeigen, indem Sie Bericht anzeigen auswählen. Ein Bericht über den Verlauf der Synchronisation enthält Einzelheiten zum Fortschritt und Status der einzelnen Dokumente im Synchronisierungsauftrag. Er zeigt an, ob ein Dokument während der Crawl-, Synchronisierungs- und Indexierungsphase erfolgreich war, fehlgeschlagen ist oder ob es übersprungen wurde. Sie finden dort auch alle Fehlermeldungen, die sich auf fehlgeschlagene oder übersprungene Dokumente beziehen. Wenn der Bericht keine Ergebnisse für einen laufenden Synchronisierungsauftrag anzeigt, sind die Protokolle möglicherweise noch nicht verfügbar. Schauen Sie später noch einmal vorbei, da Daten an den Bericht gesendet werden, wenn während des Synchronisierungsvorgangs Ereignisse auftreten.

Gehen Sie wie folgt vor, um auf Ihren Bericht zum Verlauf der Synchronisierungsläufe zuzugreifen:

  1. Öffnen Sie die Amazon Kendra Kendra-Konsole unter https://console.aws.amazon.com/kendra/.

  2. Wählen Sie im linken Navigationsmenü unter Datenverwaltung die Option Datenquellen und dann Ihre Datenquelle aus.

  3. Scrollen Sie auf der Übersichtsseite der Datenquelle nach unten und wählen Sie den Tab Synchronisierungsverlauf aus.

  4. Wählen Sie unter Synchronisierungslaufverlauf die Option Aktionen aus.

  5. Wählen Sie unter Aktionen die Option Bericht anzeigen aus. Sie werden zur CloudWatch Konsole weitergeleitet, über die Sie auf Ihren Bericht zugreifen können.

Anmerkung

Ein Synchronisierungslaufverlauf zeichnet für alle von Amazon Kendra unterstützten Konnektoren auf, ob ein Dokument während der Aufnahme erfolgreich indexiert wurde, einschließlich angehängter Dokumente ACLs und Metadaten.

Wenn Sie den Amazon S3 S3-Connector verwenden:

Zusätzlich zur Anzeige des Synchronisierungsverlaufs auf Dokumentebene in CloudWatch können Sie Synchronisierungsverlaufsberichte für jedes Dokument in Ihrer Amazon S3 S3-Datenquelle erstellen und diese in ein Amazon S3 Eimer. Während dieses Vorgangs werden Ihre Daten verschlüsselt mit AWS KMS Schlüssel und können nur von Ihnen eingesehen werden. Der Status des gemeldeten Dokuments kann einer der folgenden sein: Fehlgeschlagen, Abgeschlossen oder Erfolgreich mit Fehlern. Bevor Sie Synchronisierungsstatusberichte für Amazon S3 erstellen können, müssen Sie wie folgt vorgehen:

  • Fügen Sie Folgendes hinzu Amazon Kendra Service Principal zu Ihrem Amazon S3 Zugriffsrichtlinie

    { “Version”: “2012-10-17", “Statement”: [ { “Sid”: “KendraS3Access”, “Effect”: “Allow”, “Principal”: { “Service”: “kendra.amazonaws.com” }, “Action”: “s3:PutObject”, “Resource”: “arn:aws:s3:::your-manifest-bucket-name/*” } ] }
  • Erstellen Sie ein Amazon S3 Bucket mit Zugriffsberechtigungen für Amazon Kendra

Wenn Sie die Konsole verwenden, um einen Synchronisierungsverlaufsbericht für Amazon S3 zu generieren, aktivieren Sie auf der Seite mit den Datenquellendetails im Abschnitt Synchronisierungsverlaufsberichte — optional die Option Berichte generieren. Geben Sie dann den Amazon S3 Bucket-Standort und wählen Sie aus den verfügbaren Konfigurationsoptionen aus. Berichte werden bei der nächsten Synchronisierung generiert, nachdem Sie die Option Bericht generieren aktiviert haben.

Wenn Sie das löschen Amazon S3 Bucket, Sie verlieren Ihre Protokolldaten und müssen einen neuen Bucket einrichten, um neue Synchronisierungsberichte zu speichern.

Anmerkung

Ein Synchronisierungsverlaufsbericht enthält nur Informationen darüber, ob ein Amazon S3 S3-Connector erfolgreich Daten gecrawlt und aufgenommen hat.