

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Crie um AWS Glue rastreador
<a name="configure-custom-reports-create-crawler"></a>

AWS Glue é um serviço de extração, transformação e carregamento (ETL) totalmente gerenciado que permite criar um banco de dados a partir dos dados do Amazon S3 e consultar esse banco de dados usando o Athena. Esse banco de dados também é conhecido como Catálogo AWS Glue de Dados. Um AWS Glue rastreador pode detectar automaticamente o esquema dos seus dados do Amazon S3 e criar o banco de dados e as tabelas correspondentes. WorkSpaces Os aplicativos fornecem um CloudFormation modelo que você pode usar para criar os AWS Glue recursos necessários. 

**Importante**  
A conclusão das etapas do procedimento a seguir cria um AWS Glue rastreador. Porém, estas etapas não iniciam o crawler. Para iniciar o crawler, você deve executar as etapas do próximo procedimento. Para obter mais informações sobre AWS Glue rastreadores, consulte [Definindo](https://docs.aws.amazon.com/glue/latest/dg/add-crawler.html) rastreadores.

**Para criar um AWS Glue rastreador**

1. Abra o console de WorkSpaces aplicativos em [https://console.aws.amazon.com/appstream2/casa](https://console.aws.amazon.com/appstream2/home).

1. Escolha a AWS região para a qual você se inscreveu para receber relatórios de uso.

1. No painel de navegação, escolha **Usage Reports (Relatórios de uso)** e verifique se o registro em log está habilitado.

1. Na guia **Detalhes do relatório**, no parágrafo ao lado do **Analytics**, escolha o link do **CloudFormationmodelo**.

   A escolha do link abre o CloudFormation console, onde você pode revisar os parâmetros da CloudFormation pilha especificada pelo modelo antes de executá-la. O modelo, quando executado, cria um AWS Glue rastreador e vários exemplos de consultas do Athena.

1. Na página **Especificar detalhes**, ao lado de **ScheduleExpression**, mantenha o valor padrão ou especifique um valor de expressão cron diferente para a frequência com que você deseja executar o rastreador. Não altere nenhum outro valor padrão. Quando concluir, selecione **Próximo**.

   Por padrão, o crawler está programado para ser executado diariamente, mas você pode configurar o crawler para ser executado semanalmente, mensalmente ou com outra frequência. Para obter informações sobre a sintaxe cron, consulte [Expressões cron](https://docs.aws.amazon.com/AmazonCloudWatch/latest/events/ScheduledEvents.html#CronExpressions).

1. Na página **Options (Opções)**, mantenha os valores padrão e escolha **Next (Próximo)**.

1. Na página de **revisão**, marque a caixa de seleção ao lado de “Eu reconheço que CloudFormation pode criar recursos do IAM com nomes personalizados” e, em seguida, escolha **Criar**.

   Você deve ter permissões AWS Glue e AWS Identity and Access Management (IAM) suficientes para criar e executar a CloudFormation pilha. Se você não tiver as permissões necessárias, peça ao administrador da sua conta da Amazon Web Services para executar essas etapas na sua conta ou conceder as permissões a seguir.

------
#### [ JSON ]

****  

   ```
   {
       "Version":"2012-10-17",		 	 	 
       "Statement": [
           {
               "Effect": "Allow",
               "Action": [
                   "athena:CreateNamedQuery",
                   "athena:BatchGetNamedQuery",
                   "athena:GetNamedQuery",
                   "athena:StartQueryExecution",
                   "athena:GetQueryResults",
                   "athena:GetQueryExecution",
                   "athena:ListNamedQueries",
                   "cloudformation:DescribeStacks",
                   "cloudformation:GetStackPolicy",
                   "cloudformation:DescribeStackEvents",
                   "cloudformation:CreateStack",
                   "cloudformation:GetTemplate",
                   "cloudformation:ListChangeSets",
                   "cloudformation:ListStackResources",
                   "iam:GetRole",
                   "iam:CreateRole",
                   "iam:GetRolePolicy",
                   "s3:GetBucketLocation",
                   "s3:ListBucketMultipartUploads",
                   "s3:ListBucket",
                   "s3:ListMultipartUploadParts",
                   "s3:PutObject",
                   "s3:GetObject",
                   "s3:AbortMultipartUpload"
               ],
               "Resource": [
                   "arn:aws:iam::*:role/AppStreamUsageReports-AppStreamUsageReportGlueRole*",
                   "arn:aws:cloudformation:*:*:stack/AppStreamUsageReports/*",
                   "arn:aws:athena:*:*:workgroup/primary",
                   "arn:aws:s3:::aws-athena-query-results-*"
               ]
           },
           {
               "Effect": "Allow",
               "Action": [
                   "iam:AttachRolePolicy",
                   "iam:PutRolePolicy",
                   "s3:GetObject",
                   "s3:ListBucket"
               ],
               "Resource": [
                   "arn:aws:s3:::appstream-logs-*",
                   "arn:aws:iam::*:role/AppStreamUsageReports-AppStreamUsageReportGlueRole*"
               ]
           },
           {
               "Effect": "Allow",
               "Action": [
                   "iam:PassRole"
               ],
               "Resource": [
                   "arn:aws:iam::*:role/AppStreamUsageReports-AppStreamUsageReportGlueRole*"
               ],
               "Condition": {
                   "StringEquals": {
                       "iam:PassedToService": "glue.amazonaws.com"
                   }
               }
           },
           {
               "Effect": "Allow",
               "Action": [
                   "cloudformation:GetTemplateSummary",
                   "glue:GetResourcePolicy",
                   "glue:GetCrawlers",
                   "glue:BatchGetCrawlers",
                   "glue:GetClassifiers",
                   "glue:CreateClassifier",
                   "glue:ListCrawlers",
                   "glue:GetTags",
                   "glue:GetCrawlerMetrics",
                   "glue:GetClassifier",
                   "tag:GetResources"
               ],
               "Resource": "*"
           },
           {
               "Effect": "Allow",
               "Action": "athena:RunQuery",
               "Resource": "arn:aws:athena:*:*:workgroup/primary"
           },
           {
               "Effect": "Allow",
               "Action": [
                   "glue:GetTables",
                   "glue:GetPartitions",
                   "glue:GetTable"
               ],
               "Resource": [
                   "arn:aws:glue:*:*:table/appstream-usage/*",
                   "arn:aws:glue:*:*:database/appstream-usage",
                   "arn:aws:glue:*:*:catalog"
               ]
           },
           {
               "Effect": "Allow",
               "Action": [
                   "glue:GetDatabase",
                   "glue:CreateDatabase",
                   "glue:GetDatabases"
               ],
               "Resource": [
                   "arn:aws:glue:*:*:database/appstream-usage",
                   "arn:aws:glue:*:*:catalog"
               ]
           },
           {
               "Effect": "Allow",
               "Action": [
                   "glue:GetCrawler",
                   "glue:StartCrawler",
                   "glue:CreateCrawler"
               ],
               "Resource": "arn:aws:glue:*:*:crawler/appstream-usage*"
           },
           {
               "Effect": "Allow",
               "Action": "glue:GetCatalogImportStatus",
               "Resource": "arn:aws:glue:*:*:catalog"
           }
       ]
   }
   ```

------