Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Apache Airflow v2-Umgebungsmetriken in CloudWatch
Apache Airflow v2 ist bereits dafür eingerichtet, StatsD-Metriken
Inhalt
Bedingungen
- Namespace
-
Ein Namespace ist ein Container für die CloudWatch Metriken eines AWS Dienstes. Für Amazon MWAA ist der Namespace Amazon MWAA.
- CloudWatch Metriken
-
Eine CloudWatch Metrik stellt einen zeitlich geordneten Satz von Datenpunkten dar, die spezifisch für sind. CloudWatch
- Apache Airflow-Metriken
-
Die spezifischen Metriken
für Apache Airflow. - Dimension
-
Eine Dimension ist ein Name-Wert-Paar, das zur Identifizierung einer Metrik beiträgt.
- Einheit
-
Eine Statistik hat eine Maßeinheit. Bei Amazon MWAA umfassen die Einheiten Anzahl, Sekunden und Millisekunden. Für Amazon MWAA werden die Einheiten auf der Grundlage der Einheiten in den ursprünglichen Airflow-Metriken festgelegt.
Dimensionen
In diesem Abschnitt wird die Gruppierung von CloudWatch Dimensionen für Apache Airflow-Metriken unter beschrieben. CloudWatch
Dimension | Beschreibung |
---|---|
DAG |
Zeigt einen bestimmten Apache DAG Airflow-Namen an. |
DAGDateiname |
Zeigt einen bestimmten Apache DAG Airflow-Dateinamen an. |
Funktion |
Diese Dimension wird verwendet, um die Gruppierung von Metriken in zu verbessern. CloudWatch |
Aufgabe |
Zeigt einen Apache Airflow-Job an, der vom Scheduler ausgeführt wird. Hat immer den Wert Job. |
Operator |
Zeigt einen bestimmten Apache Airflow-Operator an. |
Pool |
Weist auf einen bestimmten Apache Airflow-Workerpool hin. |
Aufgabe |
Weist auf eine bestimmte Apache Airflow-Aufgabe hin. |
HostName |
Gibt den Hostnamen für einen bestimmten laufenden Apache Airflow-Prozess an. |
Zugreifen auf Metriken in der Konsole CloudWatch
In diesem Abschnitt wird beschrieben, wie Sie auf Leistungsmetriken CloudWatch für einen bestimmten Bereich zugreifen könnenDAG.
So zeigen Sie Leistungskennzahlen für eine Dimension an
-
Öffnen Sie die Seite „Metriken“
in der CloudWatch Konsole. -
Verwenden Sie die AWS Regionsauswahl, um Ihre Region auszuwählen.
-
Wählen Sie den MWAAAmazon-Namespace.
-
Wählen Sie auf der Registerkarte Alle Metriken eine Dimension aus. Zum DAGBeispiel Umwelt.
-
Wählen Sie eine CloudWatch Metrik für eine Dimension. Zum Beispiel TaskInstanceSuccesses oder TaskInstanceDuration. Wählen Sie Alle Suchergebnisse grafisch darstellen aus.
-
Wählen Sie die Registerkarte Graphische Metriken, um Leistungsstatistiken für Apache Airflow-Metriken wie Umgebung DAG und Aufgabe anzuzeigen.
Apache Airflow-Metriken sind verfügbar in CloudWatch
In diesem Abschnitt werden die Apache Airflow-Metriken und -Dimensionen beschrieben, die an gesendet werden. CloudWatch
Apache Airflow-Zähler
Die Apache Airflow-Metriken in diesem Abschnitt enthalten Daten zu Apache
CloudWatch Metrik | Apache Airflow-Metrik | Einheit | Dimension |
---|---|---|---|
SLAMissed AnmerkungVerfügbar für Apache Airflow v2.4.3 und höher. |
sla_missing |
Anzahl |
Funktion, Scheduler |
F ailedSLACallback AnmerkungVerfügbar für Apache Airflow v2.4.3 und höher. |
sla_callback_notification_failure |
Anzahl |
Funktion, Scheduler |
Aktualisierungen AnmerkungVerfügbar für Apache Airflow v2.6.3 und höher. |
dataset.updates |
Anzahl |
Funktion, Scheduler |
Verwaist AnmerkungVerfügbar für Apache Airflow v2.6.3 und höher. |
dataset.verwaist |
Anzahl |
Funktion, Scheduler |
FailedCeleryTaskExecution AnmerkungVerfügbar für Apache Airflow v2.4.3 und höher. |
celery.execute_command.failure |
Anzahl |
Funktion, Sellerie |
FilePathQueueUpdateCount AnmerkungVerfügbar für Apache Airflow v2.6.3 und höher. |
dag_processing.file_path_queue_update_count |
Anzahl |
Funktion, Scheduler |
CriticalSectionBusy |
scheduler.critical_section_busy |
Anzahl |
Funktion, Scheduler |
DagBagSize |
dagbag_size |
Anzahl |
Funktion, Verarbeitung DAG |
DagCallbackExceptions |
dag.callback_exceptions |
Anzahl |
DAG, Alle |
F ailedSLAEmail Versuche |
sla_email_notification_failure |
Anzahl |
Funktion, Scheduler |
TaskInstanceFinished |
bis ich fertig bin. {tag_id}. {Aufgaben-ID}. {Bundesstaat} |
Anzahl |
DAG, {tag_id} Aufgabe, {task_id} Bundesstaat, {Bundesstaat} |
JobEnd |
{Jobname} _Ende |
Anzahl |
Job, {job_name} |
JobHeartbeatFailure |
{Jobname} _Heartbeat_Failure |
Anzahl |
Job, {job_name} |
JobStart |
{Jobname} _Start |
Anzahl |
Job, {job_name} |
ManagerStalls |
dag_processing.manager_stalls |
Anzahl |
Funktion, Verarbeitung DAG |
OperatorFailures |
operator_failures_ {operator_name} |
Anzahl |
Betreiber, {operator_name} |
OperatorSuccesses |
operator_successes_ {operator_name} |
Anzahl |
Betreiber, {operator_name} |
OtherCallbackCount AnmerkungVerfügbar in Apache Airflow v2.6.3 und höher. |
dag_processing.other_callback_count |
Anzahl |
Funktion, Scheduler |
Prozesse |
dag_processing.processes |
Anzahl |
Funktion, Verarbeitung DAG |
SchedulerHeartbeat |
scheduler_heartbeat |
Anzahl |
Funktion, Scheduler |
StartedTaskInstances |
ti.start. {tag_id}. {Aufgaben-ID} |
Anzahl |
DAG, Alle Aufgabe, Alle |
SlaCallbackCount |
dag_processing.sla_callback_count AnmerkungVerfügbar für Apache Airflow v2.6.3 und höher. |
Anzahl |
Funktion, Scheduler |
TasksKilledExternally |
scheduler.tasks.killed_external |
Anzahl |
Funktion, Scheduler |
TaskTimeoutError |
celery.task_timeout_error |
Anzahl |
Funktion, Sellerie |
TaskInstanceCreatedUsingOperator |
task_instance_created- {Operatorname} |
Anzahl |
Betreiber, {operator_name} |
TaskInstancePreviouslySucceeded |
vorherig_erfolgreich |
Anzahl |
DAG, Alle Aufgabe, Alle |
TaskInstanceFailures |
ti_failures |
Anzahl |
DAG, Alle Aufgabe, Alle |
TaskInstanceSuccesses |
ti_successes |
Anzahl |
DAG, Alle Aufgabe, Alle |
TaskRemovedFromDAG |
task_removed_from_dag. {tag_id} |
Anzahl |
DAG, {tag_id} |
TaskRestoredToDAG |
task_to_day wiederhergestellt. {tag_id} |
Anzahl |
DAG, {tag_id} |
TriggersSucceeded AnmerkungVerfügbar für Apache Airflow v2.7.2 und höher. |
triggers.erfolgreich |
Anzahl |
Funktion, Auslöser |
TriggersFailed AnmerkungVerfügbar für Apache Airflow v2.7.2 und höher. |
triggers.failed |
Anzahl |
Funktion, Auslöser |
TriggersBlockedMainThread AnmerkungVerfügbar für Apache Airflow v2.7.2 und höher. |
triggers.blocked_main_thread |
Anzahl |
Funktion, Auslöser |
TriggerHeartbeat AnmerkungVerfügbar für Apache Airflow v2.8.1 und höher. |
triggerer_heartbeat |
Anzahl |
Funktion, Triggerer |
TaskInstanceCreatedUsingOperator |
airflow.task_instance_created_ AnmerkungVerfügbar für Apache Airflow v2.7.2 und höher. |
Anzahl |
Betreiber, |
ZombiesKilled |
Zombies_getötet |
Anzahl |
DAG, Alle Aufgabe, Alle |
Apache Luftstrommessgeräte
Die Apache Airflow-Metriken in diesem Abschnitt enthalten Daten zu Apache
CloudWatch Metrik | Apache Airflow-Metrik | Einheit | Dimension |
---|---|---|---|
DAGFileRefreshError |
dag_file_refresh_error |
Anzahl |
Funktion, Verarbeitung DAG |
ImportErrors |
dag_processing.import_errors |
Anzahl |
Funktion, Verarbeitung DAG |
ExceptionFailures |
smart_sensor_operator.exception_failures |
Anzahl |
Funktion, intelligenter Sensor-Operator |
ExecutedTasks |
smart_sensor_operator.executed_tasks |
Anzahl |
Funktion, intelligenter Sensor-Operator |
InfraFailures |
smart_sensor_operator.infra_failures |
Anzahl |
Funktion, intelligenter Sensor-Operator |
LoadedTasks |
smart_sensor_operator.loaded_tasks |
Anzahl |
Funktion, intelligenter Sensoroperator |
TotalParseTime |
dag_processing.total_parse_time |
Sekunden |
Funktion, Verarbeitung DAG |
TriggeredDagRuns AnmerkungVerfügbar in Apache Airflow v2.6.3 und höher. |
dataset.triggered_dagruns |
Anzahl |
Funktion, Scheduler |
TriggersRunning AnmerkungVerfügbar in Apache Airflow v2.7.2 und höher. |
löst aus. Wird ausgeführt. |
Anzahl |
Funktion, Auslöser HostName, |
PoolDeferredSlots AnmerkungVerfügbar in Apache Airflow v2.7.2 und höher. |
pool.deferred_slots. |
Anzahl |
Schwimmbad, {Poolname} |
DAGFileProcessingLastRunSecondsAgo |
dag_processing.last_run.seconds_ago. {dag_Dateiname} |
Sekunden |
DAGDateiname, {dag_filename} |
OpenSlots |
executor.open_slots |
Anzahl |
Funktion, Executor |
OrphanedTasksAdopted |
scheduler.orphaned_tasks.adoptiert |
Anzahl |
Funktion, Scheduler |
OrphanedTasksCleared |
scheduler.orphaned_tasks.clear |
Anzahl |
Funktion, Scheduler |
PokedExceptions |
smart_sensor_operator.poked_exception |
Anzahl |
Funktion, intelligenter Sensor-Operator |
PokedSuccess |
smart_sensor_operator.poked_success |
Anzahl |
Funktion, intelligenter Sensoroperator |
PokedTasks |
smart_sensor_operator.poked_tasks |
Anzahl |
Funktion, intelligenter Sensoroperator |
PoolFailures |
pool.open_slots. {Poolname} |
Anzahl |
Schwimmbad, {Poolname} |
PoolStarvingTasks |
pool.starving_tasks. {Poolname} |
Anzahl |
Schwimmbad, {Poolname} |
PoolOpenSlots |
pool.open_slots. {Poolname} |
Anzahl |
Schwimmbad, {Poolname} |
PoolQueuedSlots |
pool.queued_slots. {Poolname} |
Anzahl |
Schwimmbad, {Poolname} |
PoolRunningSlots |
pool.running_slots. {Poolname} |
Anzahl |
Schwimmbad, {Poolname} |
ProcessorTimeouts |
dag_processing.processor_timeouts |
Anzahl |
Funktion, Verarbeitung DAG |
QueuedTasks |
executor.queued_tasks |
Anzahl |
Funktion, Executor |
RunningTasks |
executor.running_tasks |
Anzahl |
Funktion, Executor |
TasksExecutable |
scheduler.tasks.executable |
Anzahl |
Funktion, Scheduler |
TasksPending AnmerkungGilt nicht für Apache Airflow v2.2 und höher. |
scheduler.tasks.pending |
Anzahl |
Funktion, Scheduler |
TasksRunning |
scheduler.tasks.running |
Anzahl |
Funktion, Scheduler |
TasksStarving |
scheduler.tasks.starving |
Anzahl |
Funktion, Scheduler |
TasksWithoutDagRun |
scheduler.tasks.without_dagrun |
Anzahl |
Funktion, Scheduler |
DAGFileProcessingLastNumOfDbQueries AnmerkungVerfügbar in Apache Airflow v2.10.1 und höher. |
dag_processing.last_num_of_db_queries. {dag_Dateiname} | Anzahl |
DAGDateiname, {dag_filename} |
PoolScheduledSlotsAnmerkungVerfügbar in Apache Airflow v2.10.1 und höher. |
pool.scheduled_slots. {Poolname} | Anzahl |
Schwimmbad, {Poolname} |
TaskCpuUsageAnmerkungVerfügbar in Apache Airflow v2.10.1 und höher. |
CPU-Nutzung. {tag_id}. {Aufgaben-ID} | Prozent |
DAG, {tag_id} Aufgabe, {task_id} |
TaskMemoryUsageAnmerkungVerfügbar in Apache Airflow v2.10.1 und höher. |
Speicherverbrauch. {tag_id}. {Aufgaben-ID} | Prozent |
DAG, {tag_id} Aufgabe, {task_id} |
Apache Airflow Timer
Die Apache Airflow-Metriken in diesem Abschnitt enthalten Daten über Apache
CloudWatch Metrik | Apache Airflow-Metrik | Einheit | Dimension |
---|---|---|---|
C ollectDBDags |
sammle_db_dags |
Millisekunden |
Funktion, Verarbeitung DAG |
CriticalSectionDuration |
scheduler.critical_section_duration |
Millisekunden |
Funktion, Scheduler |
CriticalSectionQueryDuration AnmerkungVerfügbar für Apache Airflow v2.5.1 und höher. |
scheduler.critical_section_query_duration |
Millisekunden |
Funktion, Scheduler |
DAGDependencyCheck |
dagrun.dependency-check. {tag_id} |
Millisekunden |
DAG, {tag_id} |
DAGDurationFailed |
dagrun.duration.ist fehlgeschlagen. {dag_id} |
Millisekunden |
DAG, {tag_id} |
DAGDurationSuccess |
dagrun.duration.success. {tag_id} |
Millisekunden |
DAG, {tag_id} |
DAGFileProcessingLastDuration |
dag_processing.last_duration. {dag_Dateiname} |
Sekunden |
DAGDateiname, {dag_filename} |
DAGScheduleDelay |
dagrun.schedule_delay. {tag_id} |
Millisekunden |
DAG, {tag_id} |
FirstTaskSchedulingDelay |
Dagrun. {tag_id} .first_task_scheduling_delay |
Millisekunden |
DAG, {dag_id} |
SchedulerLoopDuration AnmerkungVerfügbar für Apache Airflow v2.5.1 und höher. |
scheduler.scheduler_loop_duration |
Millisekunden |
Funktion, Scheduler |
TaskInstanceDuration |
Tag. {tag_id}. {task_id} .dauer |
Millisekunden |
DAG, {tag_id} Aufgabe, {task_id} |
TaskInstanceQueuedDuration |
Tag. AnmerkungVerfügbar für Apache Airflow v2.7.2 und höher. |
Millisekunden |
DAG, {dag_id} Aufgabe, {task_id} |
TaskInstanceScheduledDuration AnmerkungVerfügbar für Apache Airflow v2.7.2 und höher. |
Tag. |
Millisekunden |
DAG, {tag_id} Aufgabe, {task_id} |
Auswahl der Metriken, die gemeldet werden
Mithilfe der folgenden MWAA Amazon-Konfigurationsoptionen können Sie wählen CloudWatch, welche Apache Airflow-Metriken an Apache Airflow gesendet oder von Apache Airflow blockiert werden:
metrics.metrics_allow_list
— Eine Liste von kommagetrennten Präfixen, anhand derer Sie auswählen können, an welche Metriken von Ihrer Umgebung ausgegeben werden. CloudWatch Verwenden Sie diese Option, wenn Sie möchten, dass Apache Airflow nicht alle verfügbaren Metriken sendet und stattdessen eine Teilmenge von Elementen auswählt. Beispiel,scheduler,executor,dagrun
.metrics.metrics_block_list
— Eine Liste von kommagetrennten Präfixen, um Metriken herauszufiltern, die mit den Elementen der Liste beginnen. Beispiel,scheduler,executor,dagrun
.
Wenn Sie sowohl als auch metrics.metrics_allow_list
konfigurieren, ignoriert Apache metrics.metrics_block_list
Airflow. metrics.metrics_block_list
Wenn Sie konfigurieren, metrics.metrics_block_list
aber nichtmetrics.metrics_allow_list
, filtert Apache Airflow die Elemente heraus, die Sie angeben. metrics.metrics_block_list
Anmerkung
Die Optionen metrics.metrics_allow_list
und die metrics.metrics_block_list
Konfigurationsoptionen gelten nur für Apache Airflow v2.6.3 und höher. Verwenden Sie für frühere Versionen von Apache Airflow stattdessen und. metrics.statsd_allow_list
metrics.statsd_block_list
Als nächstes
-
Erkunden Sie den MWAA API Amazon-Betrieb, der zur Veröffentlichung von Umweltgesundheitskennzahlen verwendet wurde, unter PublishMetrics.