Programar scripts de ETL do AWS Glue em PySpark - AWS Glue

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Programar scripts de ETL do AWS Glue em PySpark

É possível encontrar exemplos de código Python e utilitários para o AWS Glue no repositório de exemplos do AWS Glue no site do GitHub.

Usar o Python com o AWS Glue

O AWS Glue oferece suporte a uma extensão do dialeto PySpark Python para criar scripts de trabalhos de extração, transformação e carregamento (ETL). Esta seção descreve como usar o Python em scripts de ETL e com a API do AWS Glue.

Extensões PySpark do AWS Glue

O AWS Glue criou as seguintes extensões para o dialeto PySpark Python.

Transformações PySpark do AWS Glue

O AWS Glue criou as seguintes classes de transformação para uso nas operações de ETL PySpark.