Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Monitoraggio di Amazon Kendra con Amazon Logs CloudWatch
Amazon Kendra utilizza CloudWatch Amazon Logs per fornirti informazioni dettagliate sul funzionamento delle tue fonti di dati. Amazon Kendra registra i dettagli del processo per i documenti man mano che vengono indicizzati. Registra gli errori provenienti dalla fonte di dati che si verificano durante l'indicizzazione dei documenti. CloudWatch I registri vengono utilizzati per monitorare, archiviare e accedere ai file di registro.
CloudWatch Logs archivia gli eventi di registro in un flusso di log che fa parte di un gruppo di log. Amazon Kendra utilizza queste funzionalità come segue:
-
Gruppi di log: Amazon Kendra archivia tutti i flussi di log in un unico gruppo di log per ogni indice. Amazon Kendra crea il gruppo di log quando viene creato l'indice. L'identificatore del gruppo di log inizia sempre con «aws/kendra/».
-
Log Stream: Amazon Kendra crea un nuovo flusso di log di origine dati nel gruppo di log per ogni processo di sincronizzazione dell'indice eseguito. Inoltre, crea un nuovo flusso di log dei documenti quando un flusso raggiunge circa 500 voci.
-
Voci di log: Amazon Kendra crea una voce di log nel flusso di log mentre indicizza i documenti. Ogni voce fornisce informazioni sull'elaborazione del documento o sugli eventuali errori riscontrati.
Per ulteriori informazioni sull'uso dei CloudWatch log, consulta What Is Amazon Cloud Watch Logs nella Amazon Cloud Watch Logs User Guide.
Amazon Kendra crea due tipi di flussi di log:
Fonte di dati: flussi di log
I flussi di log delle fonti di dati pubblicano voci relative ai processi di sincronizzazione degli indici. Ogni processo di sincronizzazione crea un nuovo flusso di log che utilizza per pubblicare le voci. Il nome del flusso di log è:
data source id
/YYYY
-MM
-DD
-HH
/data source sync job ID
Viene creato un nuovo flusso di log per ogni processo di sincronizzazione eseguito.
Esistono tre tipi di messaggi di registro pubblicati in un flusso di log di un'origine dati:
-
Un messaggio di registro per un documento che non è stato inviato per l'indicizzazione. Di seguito è riportato un esempio di questo messaggio per un documento in una fonte di dati S3:
{ "DocumentId": "
document ID
", "S3Path": "s3://bucket
/prefix
/object
", "Message": "Failed to ingest document via BatchPutDocument.", "ErrorCode": "InvalidRequest", "ErrorMessage": "No document metadata configuration found for document attribute key city." } -
Un messaggio di registro per un documento che non è stato inviato per l'eliminazione. Di seguito è riportato un esempio di questo messaggio:
{ "DocumentId": "
document ID
", "Message": "Failed to delete document via BatchDeleteDocument.", "ErrorCode": "InvalidRequest", "ErrorMessage": "Document can't be deleted because it doesn't exist." } -
Un messaggio di log quando viene trovato un file di metadati non valido per un documento in un bucket Amazon S3. Di seguito è riportato un esempio di questo messaggio.
{ "Message": "Found invalid metadata file
bucket
/prefix
/filename
.extension
.metadata.json." } -
Per SharePoint i connettori di database, Amazon Kendra scrive messaggi nel flusso di log solo se un documento non può essere indicizzato. Di seguito è riportato un esempio del messaggio di errore registrato da Amazon Kendra.
{ "DocumentID": "
document ID
", "IndexID": "index ID
", "SourceURI": "", "CrawlStatus": "FAILED", "ErrorCode": "403", "ErrorMessage": "Access Denied", "DataSourceErrorCode": "403" }
Flussi di log dei documenti
Amazon Kendra registra le informazioni sull'elaborazione dei documenti durante l'indicizzazione. Registra una serie di messaggi per i documenti archiviati in un'origine dati Amazon S3. Registra gli errori solo per i documenti archiviati in un'origine dati Microsoft SharePoint o di database.
Se i documenti sono stati aggiunti all'indice utilizzando l'BatchPutDocumentoperazione, il flusso di log viene denominato come segue:
YYYY
-MM
-DD
-HH
/UUID
Se i documenti sono stati aggiunti all'indice utilizzando un'origine dati, il flusso di log viene denominato come segue:
dataSourceId
/YYYY
-MM
-DD
-HH
/UUID
Ogni flusso di log contiene fino a 500 messaggi.
Se l'indicizzazione di un documento non riesce, questo messaggio viene inviato al flusso di registro:
{
"DocumentId": "document ID
",
"IndexName": "index name
",
"IndexId": "index ID
"
"SourceURI": "source URI
"
"IndexingStatus": "DocumentFailedToIndex
",
"ErrorCode": "400 | 500",
"ErrorMessage": "message
"
}
Visualizza i parametri di Amazon Kendra per i tuoi lavori di sincronizzazione
Puoi visualizzare un rapporto sulla cronologia delle esecuzioni di sincronizzazione a livello di documento CloudWatch per il processo di sincronizzazione dell'origine dati selezionando Visualizza rapporto. Un rapporto sulla cronologia delle esecuzioni di sincronizzazione conterrà dettagli sull'avanzamento e sullo stato di ciascun documento nel processo di sincronizzazione. Mostra se un documento è riuscito, ha avuto esito negativo o è stato ignorato durante le fasi di scansione, sincronizzazione e indicizzazione. Troverai anche tutti i messaggi di errore relativi a documenti non riusciti o ignorati. Se il rapporto non mostra i risultati di un processo di sincronizzazione in corso, i log potrebbero non essere ancora disponibili. Ricontrolla più tardi quando i dati vengono trasmessi al rapporto man mano che si verificano eventi durante il processo di sincronizzazione.
Per accedere al rapporto sulla cronologia delle esecuzioni di sincronizzazione, procedi nel seguente modo:
-
Apri la console Amazon Kendra all'indirizzo. https://console.aws.amazon.com/kendra/
-
Dal menu di navigazione a sinistra, in Gestione dei dati, scegli Origini dati, quindi scegli la tua fonte di dati.
-
Dalla pagina di riepilogo dell'origine dati, scorri verso il basso e seleziona la scheda Cronologia di sincronizzazione.
-
Dalla cronologia di esecuzione di Sync, seleziona Azioni.
-
Da Azioni, seleziona Visualizza rapporto. Verrai reindirizzato alla CloudWatch console dove potrai accedere al rapporto.
Nota
Una sincronizzazione registra la cronologia se un documento è stato indicizzato correttamente durante l'ingestione, inclusi gli allegati ACLs e i metadati, per tutti i connettori supportati da Amazon Kendra.
Se utilizzi il connettore Amazon S3:
Oltre a visualizzare la sincronizzazione a livello di documento ed eseguire il report sulla cronologia CloudWatch, puoi generare report sulla cronologia di sincronizzazione per ogni documento nella tua fonte di dati Amazon S3 e copiarli su un Amazon S3 secchio. Durante questo processo, i dati vengono crittografati tramite AWS KMS chiavi e possono essere visualizzate solo da te. Lo stato del documento segnalato può essere uno dei seguenti: Non riuscito, Completato o Riuscito con errori. Prima di poter generare report sullo stato della sincronizzazione per Amazon S3, devi fare quanto segue:
-
Aggiungi quanto segue Amazon Kendra service principal al tuo Amazon S3 policy d'accesso
{ “Version”: “2012-10-17", “Statement”: [ { “Sid”: “KendraS3Access”, “Effect”: “Allow”, “Principal”: { “Service”: “kendra.amazonaws.com” }, “Action”: “s3:PutObject”, “Resource”: “arn:aws:s3:::your-manifest-bucket-name/*” } ] }
-
Crea un Amazon S3 bucket con autorizzazioni di accesso a Amazon Kendra
Se utilizzi la console, per generare un rapporto sulla cronologia di sincronizzazione per Amazon S3, scegli di attivare l'opzione Genera report dalla sezione Sincronizza i report sulla cronologia, facoltativa nella pagina dei dettagli dell'origine dati. Quindi, inserisci il Amazon S3 posizione del bucket e scegli tra le opzioni di configurazione disponibili. I report verranno generati dalla sincronizzazione successiva dopo l'attivazione della funzione di generazione del rapporto.
Se elimini il Amazon S3 bucket, perderai i dati di registro e dovrai configurare un nuovo bucket per archiviare i nuovi report di sincronizzazione.
Nota
Un rapporto sulla cronologia di sincronizzazione fornisce solo informazioni sul fatto che un connettore Amazon S3 abbia eseguito correttamente la scansione e l'inserimento dei dati.