Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Installazione delle dipendenze in Python
Una dipendenza Python è qualsiasi pacchetto o distribuzione non incluso nell'installazione base di Apache Airflow per la tua versione di Apache Airflow nel tuo ambiente Amazon Managed Workflows for Apache Airflow. Questo argomento descrive i passaggi per installare le dipendenze Python di Apache Airflow nell'ambiente Amazon MWAA utilizzando un file requirements.txt
nel bucket Amazon S3.
Indice
Prerequisiti
Avrai bisogno di quanto segue prima di completare i passaggi in questa pagina.
-
Autorizzazioni: al tuo AWS account deve essere stato concesso dall'amministratore l'accesso alla politica di controllo degli MWAAFull ConsoleAccess accessi di Amazon per il tuo ambiente. Inoltre, il tuo ambiente Amazon MWAA deve essere autorizzato dal tuo ruolo di esecuzione ad accedere alle AWS risorse utilizzate dal tuo ambiente.
-
Accesso: se è necessario accedere agli archivi pubblici per installare le dipendenze direttamente sul server Web, l'ambiente deve essere configurato con l'accesso al server Web di rete pubblica. Per ulteriori informazioni, consulta Modalità di accesso Apache Airflow.
-
Configurazione Amazon S3 : il bucket Amazon S3 utilizzato per archiviare i plug-in
plugins.zip
personalizzati e DAGs lerequirements.txt
dipendenze Python deve essere configurato con Public Access Blocked e Versioning Enabled.
Come funziona
Su Amazon MWAA, installi tutte le dipendenze Python caricando un file nel requirements.txt
tuo bucket Amazon S3, quindi specificando la versione del file sulla console Amazon MWAA ogni volta che aggiorni il file. Amazon MWAA viene eseguito pip3 install -r requirements.txt
per installare le dipendenze Python sullo scheduler Apache Airflow e su ciascuno dei worker.
Per eseguire le dipendenze di Python nel tuo ambiente, devi fare tre cose:
-
Crea un
requirements.txt
file localmente. -
Carica il file locale
requirements.txt
nel tuo bucket Amazon S3. -
Specificare la versione di questo file nel campo File dei requisiti sulla console Amazon MWAA.
Nota
Se è la prima volta che crei e carichi un requirements.txt
file nel tuo bucket Amazon S3, devi anche specificare il percorso del file sulla console Amazon MWAA. Devi completare questo passaggio solo una volta.
Panoramica delle dipendenze in Python
Puoi installare gli extra di Apache Airflow e altre dipendenze Python dalle dipendenze Python Package Index (.orgPyPi), Python wheels (.whl
) o Python ospitate su un repository privato conforme a /PEP-503 nel tuo ambiente. PyPi
Limiti di posizione e dimensione delle dipendenze in Python
Apache Airflow Scheduler e Workers cercano i pacchetti nel requirements.txt
file e i pacchetti vengono installati nell'ambiente in. /usr/local/airflow/.local/bin
-
Limite di dimensione. Consigliamo un
requirements.txt
file che faccia riferimento a librerie la cui dimensione combinata è inferiore a 1 GB. Più librerie Amazon MWAA deve installare, più lungo è il tempo di avvio in un ambiente. Sebbene Amazon MWAA non limiti esplicitamente la dimensione delle librerie installate, se le dipendenze non possono essere installate entro dieci minuti, il servizio Fargate andrà in timeout e tenterà di ripristinare l'ambiente a uno stato stabile.
Creazione di un file requirements.txt
I passaggi seguenti descrivono i passaggi consigliati per creare un file requirements.txt localmente.
Fase uno: testare le dipendenze di Python utilizzando l'utilità CLI di Amazon MWAA
-
L'utilità CLI (Command Line Interface) replica localmente un ambiente Amazon Managed Workflows for Apache Airflow.
-
La CLI crea localmente un'immagine del contenitore Docker simile a un'immagine di produzione Amazon MWAA. Ciò consente di eseguire un ambiente Apache Airflow locale per sviluppare e testare DAGs plug-in personalizzati e dipendenze prima della distribuzione su Amazon MWAA.
-
Per eseguire la CLI, vedi on. aws-mwaa-local-runner
GitHub
Fase due: creare il requirements.txt
La sezione seguente descrive come specificare le dipendenze Python dall'indice dei pacchetti Python in un filerequirements.txt
Caricamento requirements.txt
su Amazon S3
Puoi utilizzare la console Amazon S3 o il AWS Command Line Interface (AWS CLI) per caricare un requirements.txt
file nel tuo bucket Amazon S3.
Utilizzando il AWS CLI
Il AWS Command Line Interface (AWS CLI) è uno strumento open source che consente di interagire con i AWS servizi utilizzando i comandi nella shell della riga di comando. Per completare la procedura descritta in questa pagina, è necessario quanto segue:
Per caricare utilizzando il AWS CLI
-
Usa il seguente comando per elencare tutti i tuoi bucket Amazon S3.
aws s3 ls
-
Usa il seguente comando per elencare i file e le cartelle nel bucket Amazon S3 per il tuo ambiente.
aws s3 ls s3://
YOUR_S3_BUCKET_NAME
-
Il comando seguente carica un
requirements.txt
file in un bucket Amazon S3.aws s3 cp requirements.txt s3://
YOUR_S3_BUCKET_NAME
/requirements.txt
Utilizzo della console Amazon S3
La console Amazon S3 è un'interfaccia utente basata sul Web che consente di creare e gestire le risorse nel bucket Amazon S3.
Per caricare utilizzando la console Amazon S3
-
Apri la pagina Ambienti
sulla console Amazon MWAA. -
Scegli un ambiente.
-
Seleziona il link del bucket S3 nel codice DAG nel riquadro S3 per aprire il bucket di archiviazione sulla console Amazon S3.
-
Scegli Carica.
-
Scegli Aggiungi file.
-
Seleziona la copia locale del tuo
requirements.txt
, scegli Carica.
Installazione delle dipendenze Python nel proprio ambiente
Questa sezione descrive come installare le dipendenze caricate nel bucket Amazon S3 specificando il percorso del file requirements.txt e specificando la versione del file requirements.txt ogni volta che viene aggiornato.
Specificazione del percorso requirements.txt
sulla console Amazon MWAA (la prima volta)
Se è la prima volta che crei e carichi un requirements.txt
file nel tuo bucket Amazon S3, devi anche specificare il percorso del file sulla console Amazon MWAA. Devi completare questo passaggio solo una volta.
-
Apri la pagina Ambienti
sulla console Amazon MWAA. -
Scegli un ambiente.
-
Scegli Modifica.
-
Nel riquadro del codice DAG di Amazon S3, scegli Browse S3 accanto al file dei requisiti (campo opzionale).
-
Seleziona il
requirements.txt
file nel tuo bucket Amazon S3. -
Scegliere Choose (Scegli).
-
Scegli Avanti, Aggiorna ambiente.
È possibile iniziare a utilizzare i nuovi pacchetti subito dopo il completamento dell'aggiornamento dell'ambiente.
Specificazione della requirements.txt
versione sulla console Amazon MWAA
È necessario specificare la versione del requirements.txt
file sulla console Amazon MWAA ogni volta che si carica una nuova versione del file requirements.txt
nel bucket Amazon S3.
-
Apri la pagina Ambienti
sulla console Amazon MWAA. -
Scegli un ambiente.
-
Scegli Modifica.
-
Nel riquadro del codice DAG di Amazon S3, scegli
requirements.txt
una versione nell'elenco a discesa. -
Scegli Avanti, Aggiorna ambiente.
È possibile iniziare a utilizzare i nuovi pacchetti subito dopo il completamento dell'aggiornamento dell'ambiente.
Visualizzazione dei log per il requirements.txt
Puoi visualizzare i log di Apache Airflow per Scheduler, pianificando i flussi di lavoro e analizzando la cartella. dags
I passaggi seguenti descrivono come aprire il gruppo di log per Scheduler sulla console Amazon MWAA e visualizzare i log di Apache Airflow sulla console Logs. CloudWatch
Per visualizzare i log di un requirements.txt
-
Apri la pagina Ambienti
sulla console Amazon MWAA. -
Scegli un ambiente.
-
Scegli il gruppo di log dello scheduler Airflow nel riquadro Monitoraggio.
-
Scegli il
requirements_install_ip
log in Log Streams. -
Dovresti vedere l'elenco dei pacchetti che sono stati installati nell'ambiente all'indirizzo
/usr/local/airflow/.local/bin
. Per esempio:Collecting appdirs==1.4.4 (from -r /usr/local/airflow/.local/bin (line 1)) Downloading https://files.pythonhosted.org/packages/3b/00/2344469e2084fb28kjdsfiuyweb47389789vxbmnbjhsdgf5463acd6cf5e3db69324/appdirs-1.4.4-py2.py3-none-any.whl Collecting astroid==2.4.2 (from -r /usr/local/airflow/.local/bin (line 2))
-
Controlla l'elenco dei pacchetti e verifica se qualcuno di questi ha riscontrato un errore durante l'installazione. Se qualcosa è andato storto, potresti visualizzare un errore simile al seguente:
2021-03-05T14:34:42.731-07:00 No matching distribution found for LibraryName==1.0.0 (from -r /usr/local/airflow/.local/bin (line 4)) No matching distribution found for LibraryName==1.0.0 (from -r /usr/local/airflow/.local/bin (line 4))
Fasi successive
-
Testa DAGs i tuoi plugin personalizzati e le dipendenze Python localmente usando on. aws-mwaa-local-runner
GitHub