A integração de dados do Amazon Q no AWS Glue permite inserir a consulta/solicitação no painel do Amazon Q. Você pode inserir uma pergunta sobre a funcionalidade de integração de dados fornecida pelo AWS Glue. Uma resposta detalhada, junto com documentos de referência, será retornada.
Outro caso de uso é gerar scripts de trabalhos de ETL do AWS Glue. Você pode fazer uma pergunta sobre como realizar um trabalho de extração, transformação e carregamento de dados. Um script PySpark gerado será devolvido.
Interações de chat do Amazon Q
No console do AWS Glue, comece a criar um novo trabalho e peça ao Amazon Q: "Crie um fluxo de ETL do Glue, conecte-se a dois locais e eventos de tabelas do catálogo do Glue no meu banco de dados glue_db, junte os resultados no venueid do local e no e_venueid do evento e, em seguida, filtre por estado do local com a condição VenuEstate=='DC' e escreva em s3://amzn-s3-demo-bucket/codegen/BDB-9999/output/ no formato CSV".
Você notará que o código foi gerado. Com essa resposta, você pode aprender e entender como criar o código do AWS Glue para sua finalidade. Você pode copiar/colar o código gerado no editor de scripts e configurar espaços reservados. Depois de configurar um perfil do IAM e conexões do AWS Glue no trabalho, salve e execute o trabalho. Quando o trabalho estiver concluído, você poderá verificar se os dados resumidos permanecem no Amazon S3 conforme o esperado e podem ser usados por workloads downstream.
Interações do AWS Glue com um caderno do Studio
nota
A experiência de integração de dados do Amazon Q em cadernos do AWS Glue Studio ainda se concentra no fluxo de integração de dados baseado em DynamicFrame.
Adicione uma nova célula e insira seu comentário para descrever o que deseja alcançar. Depois de pressionar Tab e Enter, o código recomendado é exibido.
A primeira intenção é extrair os dados: "Forneça um código que leia uma tabela do Glue Data Catalog", seguido por "Forneça um código para aplicar uma transformação de filtro com star_rating>3" e "Forneça o código que grava o quadro no S3 como Parquet".
Semelhante à experiência de chat do Amazon Q, o código é recomendado. Se você pressionar Tab, o código recomendado será escolhido.
É possível executar cada célula preenchendo as opções apropriadas para as fontes no código gerado. Em qualquer momento das execuções, é possível visualizar uma amostra do seu conjunto de dados usando o método show()
.
É possível executar o caderno como um trabalho, seja programaticamente ou escolhendo Executar.
Prompts complexos
É possível gerar um script completo com um único prompt complexo. "Tenho dados JSON no S3 e dados no Oracle que precisam ser combinados. Forneça um script do Glue que leia as duas fontes, faça uma junção e, em seguida, grave os resultados no Redshift."
Você pode notar que, no caderno, a integração de dados do Amazon Q no AWS Glue gerou o mesmo trecho de código que foi gerado no chat do Amazon Q.
É possível executar o caderno como um trabalho escolhendo Executar ou programaticamente.