Analizza i log con CloudWatch Logs Insights - Servizio gestito per Apache Flink

Il servizio gestito da Amazon per Apache Flink era precedentemente noto come Analisi dei dati Amazon Kinesis per Apache Flink.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Analizza i log con CloudWatch Logs Insights

Dopo aver aggiunto un'opzione di CloudWatch registrazione all'applicazione come descritto nella sezione precedente, puoi utilizzare CloudWatch Logs Insights per interrogare i flussi di log alla ricerca di eventi o errori specifici.

CloudWatch Logs Insights consente di cercare e analizzare in modo interattivo i dati di registro in Logs. CloudWatch

Per informazioni su come iniziare a usare CloudWatch Logs Insights, consulta Analizzare i dati di log con Logs Insights. CloudWatch

Esecuzione di una query di esempio

Questa sezione descrive come eseguire una query di esempio di CloudWatch Logs Insights.

Prerequisiti

  • Gruppi di log e flussi di log esistenti configurati in CloudWatch Logs.

  • Registri esistenti archiviati in Logs. CloudWatch

Se utilizzi servizi come AWS CloudTrail Amazon Route 53 o AmazonVPC, probabilmente hai già configurato i log di tali servizi per accedere a CloudWatch Logs. Per ulteriori informazioni sull'invio di log a Logs, consulta Getting Started with CloudWatch Logs. CloudWatch

Le query in CloudWatch Logs Insights restituiscono un insieme di campi degli eventi di registro o il risultato di un'aggregazione matematica o di altre operazioni eseguite sugli eventi di registro. Questo tutorial illustra una query che restituisce un elenco di eventi di log.

Per eseguire una query di esempio di Logs CloudWatch Insights
  1. Apri la CloudWatch console all'indirizzo https://console.aws.amazon.com/cloudwatch/.

  2. Nel riquadro di navigazione, seleziona Informazioni dettagliate.

  3. L'editor di query della pagina Logs Insights contiene una query predefinita che restituisce gli ultimi 20 eventi di log. Sopra l'editor di query, seleziona un gruppo di log su cui eseguire la query.

    Quando si seleziona un gruppo di log, CloudWatch Logs Insights rileva automaticamente i campi nei dati del gruppo di log e li visualizza nei campi Scoperti nel riquadro di destra. Inoltre, visualizza un grafico a barre di eventi di log in questo gruppo di log nel tempo. Questo grafico a barre mostra la distribuzione di eventi nel gruppo di log che corrisponde alla query e all'intervallo di tempo, non solo gli eventi visualizzati nella tabella.

  4. Scegli Esegui query.

    Vengono visualizzati i risultati della query. In questo esempio, i risultati sono gli ultimi 20 eventi di log di qualsiasi tipo.

  5. Per visualizzare tutti i campi di uno degli eventi di log restituiti, scegli la freccia a sinistra dell'evento di log.

Per ulteriori informazioni su come eseguire e modificare le query di CloudWatch Logs Insights, consulta Eseguire e modificare una query di esempio.

Esamina le query di esempio

Questa sezione contiene query di esempio di CloudWatch Logs Insights per l'analisi dei log delle applicazioni Managed Service for Apache Flink. Queste query cercano diversi esempi di condizioni di errore e fungono da modelli per scrivere query che trovano altre condizioni di errore.

Nota

Sostituisci la regione (us-west-2), ID account (012345678901) e nome dell'applicazione (YourApplication) nei seguenti esempi di query con la regione dell'applicazione e l'ID dell'account.

Analizza le operazioni: distribuzione delle attività

La seguente query di CloudWatch Logs Insights restituisce il numero di attività che Apache Flink Job Manager distribuisce tra i Task Manager. È necessario impostare l'intervallo di tempo della query in modo che corrisponda a un solo processo eseguito, in modo che la query non restituisca attività dai processi precedenti. Per ulteriori informazioni sui parametri, consulta Implementa la scalabilità delle applicazioni in Managed Service for Apache Flink.

fields @timestamp, message | filter message like /Deploying/ | parse message " to flink-taskmanager-*" as @tmid | stats count(*) by @tmid | sort @timestamp desc | limit 2000

La seguente query di CloudWatch Logs Insights restituisce le sottoattività assegnate a ciascun Task Manager. Il numero totale di sottoattività è la somma del parallelismo di ogni attività. Il parallelismo delle attività deriva dal parallelismo degli operatori ed è lo stesso del parallelismo dell'applicazione per impostazione predefinita, a meno che non ne modifichi il codice specificando setParallelism. Per ulteriori informazioni sull'impostazione del parallelismo degli operatori, consulta Impostazione del parallelismo: livello dell'operatore nella documentazione di Apache Flink.

fields @timestamp, @tmid, @subtask | filter message like /Deploying/ | parse message "Deploying * to flink-taskmanager-*" as @subtask, @tmid | sort @timestamp desc | limit 2000

Per ulteriori informazioni sulla pianificazione delle attività, consulta Processi e pianificazione nella documentazione di Apache Flink.

Analisi delle operazioni: modifica del parallelismo

La seguente query di CloudWatch Logs Insights restituisce le modifiche al parallelismo di un'applicazione (ad esempio, dovute al ridimensionamento automatico). Questa query restituisce anche le modifiche manuali al parallelismo dell'applicazione. Per ulteriori informazioni sul dimensionamento automatico, consulta Usa il ridimensionamento automatico in Managed Service for Apache Flink.

fields @timestamp, @parallelism | filter message like /property: parallelism.default, / | parse message "default, *" as @parallelism | sort @timestamp asc

Analizza gli errori: accesso negato

La seguente query di CloudWatch Logs Insights restituisce i Access Denied log.

fields @timestamp, @message, @messageType | filter applicationARN like /arn:aws:kinesisanalyticsus-west-2:012345678901:application\/YourApplication/ | filter @message like /AccessDenied/ | sort @timestamp desc

Analizza gli errori: fonte o sink non trovati

La seguente query di CloudWatch Logs Insights restituisce i ResourceNotFound log. ResourceNotFoundi log risultano se non viene trovato un sorgente o un sink Kinesis.

fields @timestamp,@message | filter applicationARN like /arn:aws:kinesisanalyticsus-west-2:012345678901:application\/YourApplication/ | filter @message like /ResourceNotFoundException/ | sort @timestamp desc

Analizza gli errori: errori relativi alle attività dell'applicazione

La seguente query di CloudWatch Logs Insights restituisce i log degli errori relativi alle attività di un'applicazione. Questi log vengono generati se lo stato di un'applicazione passa da RUNNING a RESTARTING.

fields @timestamp,@message | filter applicationARN like /arn:aws:kinesisanalyticsus-west-2:012345678901:application\/YourApplication/ | filter @message like /switched from RUNNING to RESTARTING/ | sort @timestamp desc

Per le applicazioni che utilizzano Apache Flink versione 1.8.2 e precedenti, gli errori relativi alle attività comporteranno invece il passaggio dello stato dell'applicazione da RUNNING a FAILED. Quando utilizzi Apache Flink versione 1.8.2 e precedenti, la query seguente ti consente di cercare gli errori relativi alle attività dell'applicazione:

fields @timestamp,@message | filter applicationARN like /arn:aws:kinesisanalyticsus-west-2:012345678901:application\/YourApplication/ | filter @message like /switched from RUNNING to FAILED/ | sort @timestamp desc