Aktivieren der kontinuierlichen Protokollierung für AWS Glue -Aufträge - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Aktivieren der kontinuierlichen Protokollierung für AWS Glue -Aufträge

Sie können die kontinuierliche Protokollierung über die AWS Glue Konsole oder über AWS Command Line Interface (AWS CLI) aktivieren.

Sie können die kontinuierliche Protokollierung aktivieren, wenn Sie einen neuen Job erstellen, einen vorhandenen Job bearbeiten oder ihn über den aktivieren AWS CLI.

Sie können auch benutzerdefinierte Konfigurationsoptionen wie den Namen der Amazon CloudWatch Protokollgruppe, das CloudWatch Protokollstream-Präfix vor der AWS Glue Job-Ausführungs-ID, die Treiber-/Ausführungs-ID und das Protokollkonvertierungsmuster für Protokollnachrichten angeben. Diese Konfigurationen helfen Ihnen dabei, aggregierte Protokolle in benutzerdefinierten CloudWatch Protokollgruppen mit unterschiedlichen Ablaufrichtlinien einzurichten und sie mit benutzerdefinierten Protokollstream-Präfixen und Konvertierungsmustern weiter zu analysieren.

Unter Verwendung der AWS Management Console

Gehen Sie wie folgt vor, um mithilfe der Konsole die kontinuierliche Protokollierung beim Erstellen oder Bearbeiten eines AWS Glue Jobs zu aktivieren.

Um einen neuen AWS Glue Job mit kontinuierlicher Protokollierung zu erstellen
  1. Melden Sie sich bei der an AWS Management Console und öffnen Sie die AWS Glue Konsole unter https://console.aws.amazon.com/glue/.

  2. Wählen Sie im Navigationsbereich ETLJobs aus.

  3. Wählen Sie Visual ETL.

  4. Erweitern Sie auf der Registerkarte Jobdetails den Abschnitt Erweiterte Eigenschaften.

  5. Wählen Sie unter Kontinuierliche Protokollierung die Option Anmeldungen aktivieren aus CloudWatch.

Um die kontinuierliche Protokollierung für einen vorhandenen AWS Glue Job zu aktivieren
  1. Öffnen Sie die AWS Glue Konsole unter https://console.aws.amazon.com/glue/.

  2. Wählen Sie im Navigationsbereich die Option Jobs (Aufträge) aus.

  3. Wählen Sie einen Auftrag in der Liste Jobs (Aufträge) aus.

  4. Wählen Sie Action (Aktion), Edit job (Auftrag bearbeiten) aus.

  5. Erweitern Sie auf der Registerkarte Jobdetails den Abschnitt Erweiterte Eigenschaften.

  6. Wählen Sie unter Kontinuierliche Protokollierung die Option Anmeldungen aktivieren aus CloudWatch.

Verwenden des AWS CLI

Um die kontinuierliche Protokollierung zu aktivieren, übergeben Sie Jobparameter an einen AWS Glue Job. Übergeben Sie die folgenden speziellen Job-Parameter, die anderen AWS Glue Job-Parametern ähneln. Weitere Informationen finden Sie unter Verwenden von Auftragsparametern in AWS Glue-Jobs.

'--enable-continuous-cloudwatch-log': 'true'

Sie können einen benutzerdefinierten CloudWatch Amazon-Protokollgruppennamen angeben. Sofern nicht angegeben, lautet der Standardname der Protokollgruppe /aws-glue/jobs/error/.

'--continuous-log-logGroup': 'custom_log_group_name'

Sie können ein benutzerdefiniertes CloudWatch Amazon-Logstream-Präfix angeben. Sofern nicht angegeben, ist das standardmäßige Logstream-Präfix die Auftragsausführungs-ID.

'--continuous-log-logStreamPrefix': 'custom_log_stream_prefix'

Sie können ein benutzerdefiniertes Konvertierungsmuster für die kontinuierliche Protokollierung angeben. Sofern nicht angegeben, ist das Standardkonvertierungsmuster %d{yy/MM/dd HH:mm:ss} %p %c{1}: %m%n. Beachten Sie, dass das Konvertierungsmuster nur für Treiberprotokolle und Executor-Protokolle gilt. Dies wirkt sich nicht auf die AWS Glue -Fortschrittsleiste aus.

'--continuous-log-conversionPattern': 'custom_log_conversion_pattern'

Protokollieren von anwendungsspezifischen Meldungen mit dem benutzerdefinierten Skript-Logger

Sie können den AWS Glue Logger verwenden, um alle anwendungsspezifischen Meldungen im Skript zu protokollieren, die in Echtzeit an den Treiberprotokollstream gesendet werden.

Das folgende Beispiel zeigt ein Python-Skript.

from awsglue.context import GlueContext from pyspark.context import SparkContext sc = SparkContext() glueContext = GlueContext(sc) logger = glueContext.get_logger() logger.info("info message") logger.warn("warn message") logger.error("error message")

Das folgende Beispiel zeigt ein Scala-Skript.

import com.amazonaws.services.glue.log.GlueLogger object GlueApp { def main(sysArgs: Array[String]) { val logger = new GlueLogger logger.info("info message") logger.warn("warn message") logger.error("error message") } }

Aktivieren des Fortschrittsbalkens zum Anzeigen des Auftragsfortschritts

AWS Glue stellt unter dem JOB_RUN_ID-progress-bar Protokollstream eine Fortschrittsleiste in Echtzeit bereit, mit der der Status der AWS Glue Auftragsausführung überprüft werden kann. Derzeit unterstützt er nur Aufträge, die glueContext initialisieren. Wenn Sie einen reinen Spark-Job ohne Initialisierung ausführenglueContext, wird der AWS Glue Fortschrittsbalken nicht angezeigt.

Der Fortschrittsbalken wird alle 5 Sekunden aktualisiert.

Stage Number (Stage Name): > (numCompletedTasks + numActiveTasks) / totalNumOfTasksInThisStage]

Sicherheitskonfiguration mit kontinuierlicher Protokollierung

Wenn eine Sicherheitskonfiguration für CloudWatch Protokolle aktiviert ist, AWS Glue wird eine Protokollgruppe mit dem folgenden Namen für fortlaufende Protokolle erstellt:

<Log-Group-Name>-<Security-Configuration-Name>

Die Standard- und benutzerdefinierten Protokollgruppen lauten wie folgt:

  • Die standardmäßige fortlaufende Protokollgruppe lautet /aws-glue/jobs/error-<Security-Configuration-Name>

  • Die benutzerdefinierte fortlaufende Protokollgruppe lautet <custom-log-group-name>-<Security-Configuration-Name>

Sie müssen die Berechtigungen logs:AssociateKmsKey zu Ihrer IAM Rolle hinzufügen, wenn Sie eine Sicherheitskonfiguration mit CloudWatch Protokollen aktivieren. Wenn diese Berechtigung nicht enthalten ist, wird die fortlaufende Protokollierung deaktiviert. Um die Verschlüsselung für die CloudWatch Logs zu konfigurieren, folgen Sie außerdem den Anweisungen unter Log Data in CloudWatch Logs Using verschlüsseln AWS Key Management Service im Amazon CloudWatch Logs-Benutzerhandbuch.

Weitere Informationen zum Erstellen einer Sicherheitskonfiguration finden Sie hier: Sicherheitskonfigurationen auf der AWS Glue Konsole verwalten.