Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Configurar um crawler de notificações de eventos do Amazon S3 para um destino do Amazon S3

Modo de foco
Configurar um crawler de notificações de eventos do Amazon S3 para um destino do Amazon S3 - AWS Glue

Siga estas etapas para configurar um crawler para notificações de eventos do Amazon S3 para um destino do Amazon S3 usando o AWS Management Console ou a AWS CLI.

AWS Management Console
  1. Faça login no AWS Management Console e abra o console do GuardDuty em https://console.aws.amazon.com/guardduty/.

  2. Defina as propriedades do crawler. Para obter mais informações, consulte Definir opções de configuração do crawler no console do AWS Glue.

  3. Na seção Configuração da fonte de dados, é perguntado a você se Os dados já estão mapeados para tabelas do AWS Glue?

    A opção Not yet (Ainda não) já estará selecionada por padrão. Isso ocorre porque você está usando uma fonte de dados do Amazon S3 e os dados ainda não estão mapeados para as tabelas do AWS Glue.

  4. Na seção Data sources (Fontes de dados), escolha Add a data source (Adicionar uma fonte de dados).

    Data source configuration interface with options to select or add data sources for crawling.
  5. No modal Add data source (Adicionar origem dos dados), configure a fonte de dados do Amazon S3:

    • Data source (Fonte de dados): o Amazon S3 é selecionado por padrão.

    • Network connection (Conexão de rede) (opcional): escolha Add new connection (Adicionar nova conexão).

    • Location of Amazon S3 data (Local de dados do Amazon S3): a opção In this account (Nesta conta) será selecionado por padrão.

    • Amazon S3 path (Caminho do Amazon S3): especifique o caminho do Amazon S3 no qual pastas e arquivos são rastreados.

    • Subsequent crawler runs (Execuções subsequentes do crawler): escolha Crawl based on events (Rastreamento baseado em eventos) para usar notificações de eventos do Amazon S3 para seu crawler.

    • Include SQS ARN (Incluir ARN de SQS): especifique os parâmetros do armazenamento de dados, incluindo um ARN válido do SQS. (Por exemplo, arn:aws:sqs:region:account:sqs).

    • Include dead-letter SQS ARN (Incluir ARN de mensagens não entregues do SQS) (opcional): especifique um ARN válido de mensagens não entregues do SQS na Amazon. (Por exemplo, arn:aws:sqs:region:account:deadLetterQueue).

    • Escolha Add an Amazon S3 data source (Adicionar uma fonte de dados do Amazon S3).

    Add data source dialog for S3, showing options for network connection and crawl settings.
AWS CLI

O exemplo a seguir é uma chamada da AWS CLI do Amazon S3 para configurar um crawler para usar notificações de eventos para fazer crawl em um bucket de destino do Amazon S3.

Create Crawler: aws glue update-crawler \ --name myCrawler \ --recrawl-policy RecrawlBehavior=CRAWL_EVENT_MODE \ --schema-change-policy UpdateBehavior=UPDATE_IN_DATABASE,DeleteBehavior=LOG --targets '{"S3Targets":[{"Path":"s3://amzn-s3-demo-bucket/", "EventQueueArn": "arn:aws:sqs:us-east-1:012345678910:MyQueue"}]}'
  1. Faça login no AWS Management Console e abra o console do GuardDuty em https://console.aws.amazon.com/guardduty/.

  2. Defina as propriedades do crawler. Para obter mais informações, consulte Definir opções de configuração do crawler no console do AWS Glue.

  3. Na seção Configuração da fonte de dados, é perguntado a você se Os dados já estão mapeados para tabelas do AWS Glue?

    A opção Not yet (Ainda não) já estará selecionada por padrão. Isso ocorre porque você está usando uma fonte de dados do Amazon S3 e os dados ainda não estão mapeados para as tabelas do AWS Glue.

  4. Na seção Data sources (Fontes de dados), escolha Add a data source (Adicionar uma fonte de dados).

    Data source configuration interface with options to select or add data sources for crawling.
  5. No modal Add data source (Adicionar origem dos dados), configure a fonte de dados do Amazon S3:

    • Data source (Fonte de dados): o Amazon S3 é selecionado por padrão.

    • Network connection (Conexão de rede) (opcional): escolha Add new connection (Adicionar nova conexão).

    • Location of Amazon S3 data (Local de dados do Amazon S3): a opção In this account (Nesta conta) será selecionado por padrão.

    • Amazon S3 path (Caminho do Amazon S3): especifique o caminho do Amazon S3 no qual pastas e arquivos são rastreados.

    • Subsequent crawler runs (Execuções subsequentes do crawler): escolha Crawl based on events (Rastreamento baseado em eventos) para usar notificações de eventos do Amazon S3 para seu crawler.

    • Include SQS ARN (Incluir ARN de SQS): especifique os parâmetros do armazenamento de dados, incluindo um ARN válido do SQS. (Por exemplo, arn:aws:sqs:region:account:sqs).

    • Include dead-letter SQS ARN (Incluir ARN de mensagens não entregues do SQS) (opcional): especifique um ARN válido de mensagens não entregues do SQS na Amazon. (Por exemplo, arn:aws:sqs:region:account:deadLetterQueue).

    • Escolha Add an Amazon S3 data source (Adicionar uma fonte de dados do Amazon S3).

    Add data source dialog for S3, showing options for network connection and crawl settings.
PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.