Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Criar um identificador de dados personalizado

Modo de foco
Criar um identificador de dados personalizado - Amazon Macie

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Um identificador de dados personalizado é um conjunto de critérios que você define para detectar dados confidenciais em objetos do Amazon Simple Storage Service (Amazon S3). Ao criar um identificador de dados personalizado, você especifica uma expressão regular (regex) que define um padrão de texto para corresponder a um objeto S3. Você também pode especificar sequências de caracteres e uma regra de proximidade que refina os resultados. As sequências de caracteres podem ser: palavras-chave, que são palavras ou frases que devem estar próximas ao texto que corresponde ao regex, ou ignorar palavras, que são palavras ou frases para excluir dos resultados. Ao usar identificadores de dados personalizados, você pode complementar os identificadores de dados gerenciados fornecidos pelo Amazon Macie e detectar dados confidenciais que refletem cenários, propriedade intelectual ou dados proprietários particulares da organização.

Por exemplo, muitas empresas têm uma sintaxe específica para funcionários IDs. Uma dessas sintaxes pode ser: uma letra maiúscula que indica se o funcionário é funcionário em tempo integral (F) ou meio período (P), seguida por um hífen (-), seguido por uma sequência de oito dígitos que identifica o funcionário. Os exemplos são: F—12345678 para um funcionário em tempo integral e P—87654321 para um funcionário em tempo parcial. Para detectar funcionários IDs que usam essa sintaxe, você pode criar um identificador de dados personalizado que especifique o seguinte regex:. [A-Z]-\d{8} Para refinar a análise e evitar falsos positivos, você também pode configurar o identificador para usar palavras-chave (employee e employee ID) e uma distância máxima de correspondência de 20 caracteres. Com esses critérios, os resultados incluem texto que corresponda ao regex se o texto ocorrer após a palavra-chave funcionário ou ID do funcionário e todo o texto ocorrer dentro de 20 caracteres de uma dessas palavras-chave.

Para ver uma demonstração de como as palavras-chave podem ajudar você a encontrar dados confidenciais e evitar falsos positivos, assista ao vídeo a seguir:

Além dos critérios de detecção, você pode especificar configurações de severidade personalizadas para as descobertas produzidas por um identificador de dados personalizado. A severidade pode ser baseada no número de ocorrências de texto que correspondem aos critérios de detecção do identificador. Se você não especificar essas configurações, o Macie atribuirá automaticamente a severidade Média a todas as descobertas produzidas pelo identificador. A severidade não muda com base no número de ocorrências de texto que correspondem aos critérios de detecção do identificador.

Para obter informações detalhadas sobre estas e outras configurações, consulte Opções de configuração para identificadores de dados personalizados.

Para criar um identificador de dados personalizado

Você pode criar um identificador de dados personalizado usando o console do Amazon Macie ou a API do Amazon Macie.

Console

Siga estas etapas para criar um identificador de dados personalizado usando o console do Amazon Macie.

Para criar um identificador de dados personalizado
  1. Abra o console do Amazon Macie em. https://console.aws.amazon.com/macie/

  2. No painel de navegação, em Configurações, escolha Identificadores de dados personalizados.

  3. Escolha Criar.

  4. Para Nome insira um nome para o identificador de dados personalizado. Um nome pode conter até 128 caracteres.

  5. Em Descrição, você pode inserir uma breve descrição do identificador de dados personalizado. A descrição pode conter até 512 caracteres.

    nota

    Evite incluir dados confidenciais no nome ou na descrição de um identificador de dados personalizado. Outros usuários da sua conta podem acessar o nome ou a descrição, dependendo das ações que eles estão autorizados a realizar no Macie.

  6. Para Expressão regular, insira a expressão regular (regex) que define o padrão de texto a ser correspondido. Um nome regex pode conter até 512 caracteres.

    O Macie suporta um subconjunto da sintaxe do padrão fornecida pela biblioteca Perl Compatible Regular Expressions (PCRE). Para obter outros detalhes e dicas, consulte Critérios de detecção para identificadores de dados personalizados.

  7. Em Palavras-chave, você pode inserir até 50 sequências de caracteres (separadas por vírgulas) para definir um texto específico que deve estar próximo ao texto que corresponde ao padrão regex.

    O Macie inclui uma ocorrência nos resultados somente se o texto corresponder ao padrão regex e estiver dentro da distância máxima de correspondência de uma dessas palavras-chave. Cada palavra-chave pode conter de 3 a 90 caracteres UTF-8. Palavras-chave não diferenciam maiúsculas de minúsculas.

  8. Em Ignorar palavras, opcionalmente, insira até 10 sequências de caracteres (separadas por vírgulas) que definam um texto específico a ser excluído dos resultados.

    O Macie exclui uma ocorrência dos resultados se o texto corresponder ao padrão regex, mas contiver uma dessas palavras ignoradas. Cada palavra a ser ignorada pode conter de 4 a 90 caracteres UFT-8. Palavras ignoradas diferenciam maiúsculas de minúsculas.

  9. Em Distância máxima de correspondência, você pode inserir o número máximo de caracteres que pode existir entre o final de uma palavra-chave e o final do texto que corresponde ao padrão regex.

    O Macie inclui uma ocorrência nos resultados somente se o texto corresponder ao padrão regex e o texto estiver dentro dessa distância de uma palavra-chave completa. A distância pode ser de 1 a 300 caracteres. A distância padrão é de 50 caracteres.

  10. Em Severidade, escolha como determinar a severidade das descobertas de dados confidenciais produzidas pelo identificador de dados personalizado:

    • Para atribuir automaticamente a gravidade Média a todas as descobertas, escolha Usar gravidade Média para qualquer número de correspondências (padrão). Com essa opção, o Macie atribui automaticamente a gravidadeMédia a uma descoberta se o objeto S3 afetado contiver uma ou mais ocorrências de texto que correspondam aos critérios de detecção.

    • Para atribuir gravidade com base nos limites de ocorrências que você especificar, escolha Usar configurações personalizadas para determinar a gravidade. Em seguida, use as opções Limite de ocorrências e Nível de severidade para especificar o número mínimo de correspondências que devem existir em um objeto do S3 para produzir uma descoberta com uma severidade selecionada.

      Você pode especificar até três limites de ocorrências, um para cada nível de severidade suportado pelo Macie: Baixo (menos grave), Médio ou Alto (mais grave). Se você especificar mais de um, os limites deverão estar em ordem crescente por gravidade, de Baixo a Alto. Se um objeto do S3 contiver menos ocorrências do que o limite mais baixo, o Macie não criará uma descoberta.

  11. (Opcional) Em Tags, escolha Adicionar tag e, em seguida, insira até 50 tags para atribuir ao trabalho.

    Uma tag é um rótulo que você define e atribui a determinados tipos de AWS recursos. Cada tag consiste em uma chave de tag necessária e um valor de tag opcional. As tags podem ajudá-lo a identificar, categorizar e gerenciar recursos de diferentes maneiras, como por finalidade, proprietário, ambiente ou outros critérios. Para saber mais, consulte Marcar recursos do Macie.

  12. (Opcional) Em Avaliar, insira até 1.000 caracteres na caixa Dados da amostra e escolha Testar para testar os critérios de detecção. Macie avalia os dados da amostra e relata o número de ocorrências de texto que correspondem aos critérios. Você pode repetir essa etapa quantas vezes quiser para refinar e otimizar os critérios.

    nota

    É altamente recomendável que você teste e refine os critérios de detecção com dados de amostra. Como os identificadores de dados personalizados são usados por trabalhos confidenciais de descoberta de dados, você não pode alterar um identificador de dados personalizado depois de criá-lo. Isso ajuda a garantir que você tenha um histórico imutável de descobertas e resultados de descobertas de dados confidenciais.

  13. Quando terminar, escolha Enviar.

O Macie testa as configurações e verifica se pode compilar o regex. Se houver um problema com uma configuração ou com o regex, o Macie exibirá um erro descrevendo o que aconteceu. Depois de resolver qualquer problema, você pode salvar o identificador de dados personalizado.

API

Para criar um identificador de dados personalizado de forma programática, use a CreateCustomDataIdentifieroperação da API Amazon Macie. Ou, se você estiver usando o AWS Command Line Interface (AWS CLI), execute o create-custom-data-identifiercomando.

nota

Antes de criar um identificador de dados personalizado, é altamente recomendável testar e refinar seus critérios de detecção com dados de amostra. Como os identificadores de dados personalizados são usados por trabalhos confidenciais de descoberta de dados, você não pode alterar um identificador de dados personalizado depois de criá-lo. Isso ajuda a garantir que você tenha um histórico imutável de descobertas e resultados de descobertas de dados confidenciais.

Para testar os critérios de forma programática, você pode usar a TestCustomDataIdentifieroperação da API Amazon Macie. Essa operação fornece um ambiente para avaliar dados de amostra com critérios de detecção. Se você estiver usando o AWS CLI, você pode executar o test-custom-data-identifiercomando para testar os critérios.

Quando você estiver pronto para criar o identificador de dados personalizado, use os seguintes parâmetros para definir seus critérios de detecção:

  • regex— Especifique a expressão regular (regex) que define o padrão de texto a ser correspondente. A regex pode conter até 512 caracteres.

    O Macie suporta um subconjunto da sintaxe do padrão fornecida pela biblioteca Perl Compatible Regular Expressions (PCRE). Para obter outros detalhes e dicas, consulte Critérios de detecção para identificadores de dados personalizados.

  • keywords— Opcionalmente, especifique sequências de 1 a 50 caracteres (palavras-chave) que devem estar próximas ao texto que corresponda ao padrão regex.

    O Macie inclui uma ocorrência nos resultados somente se o texto corresponder ao padrão regex e estiver dentro da distância máxima de correspondência de uma dessas palavras-chave. Cada palavra-chave pode conter de 3 a 90 caracteres UTF-8. Palavras-chave não diferenciam maiúsculas de minúsculas.

  • maximumMatchDistance— Opcionalmente, especifique o número máximo de caracteres que podem existir entre o final de uma palavra-chave e o final do texto que corresponda ao padrão regex. Se você estiver usando o AWS CLI, use o maximum-match-distance parâmetro para especificar esse valor.

    O Macie inclui uma ocorrência nos resultados somente se o texto corresponder ao padrão regex e o texto estiver dentro dessa distância de uma palavra-chave completa. A distância pode ser de 1 a 300 caracteres. A distância padrão é de 50 caracteres.

  • ignoreWords— Opcionalmente, especifique sequências de 1 a 10 caracteres (ignore palavras) para excluir dos resultados. Se você estiver usando o AWS CLI, use o ignore-words parâmetro para especificar essas sequências de caracteres.

    O Macie exclui uma ocorrência dos resultados se o texto corresponder ao padrão regex, mas contiver uma dessas palavras ignoradas. Cada palavra a ser ignorada pode conter de 4 a 90 caracteres UFT-8. Palavras ignoradas diferenciam maiúsculas de minúsculas.

Para especificar a severidade das descobertas de dados confidenciais que o identificador de dados personalizado produz, use o severityLevels parâmetro ou, se estiver usando o AWS CLI, o severity-levels parâmetro:

  • Para atribuir automaticamente a MEDIUM severidade a todas as descobertas, omita esse parâmetro. Em seguida, Macie usa a configuração padrão. Por padrão, o Macie atribui a MEDIUM severidade a uma descoberta se o objeto do S3 afetado contiver uma ou mais ocorrências de texto que correspondam aos critérios de detecção.

  • Para atribuir severidade com base nos limites de ocorrências que você especifica, especifique o número mínimo de correspondências que devem existir em um objeto do S3 para produzir uma descoberta com uma severidade especificada.

    Você pode especificar até três limites de ocorrências, um para cada nível de severidade suportado pelo Macie: LOW (menos grave) ou HIGH (mais grave). MEDIUM Se você especificar mais de um, os limites deverão estar em ordem crescente por severidade, passando de LOW para. HIGH Se um objeto do S3 contiver menos ocorrências do que o limite mais baixo, o Macie não criará uma descoberta.

Use parâmetros adicionais para especificar um nome e outras configurações, como tags, para o identificador de dados personalizado. Evite incluir dados confidenciais nessas configurações. Outros usuários da sua conta podem acessar esses valores, dependendo das ações que eles estão autorizados a realizar no Macie.

Quando você envia sua solicitação, o Macie testa as configurações e verifica se ele pode compilar o regex. Se houver um problema com uma configuração ou com o regex, a solicitação falhará e o Macie retornará uma mensagem descrevendo o problema. Se a solicitação for bem-sucedida, você receberá uma saída semelhante à seguinte:

{ "customDataIdentifierId": "393950aa-82ea-4bdc-8f7b-e5be3example" }

Onde customDataIdentifierId especifica o identificador exclusivo (ID) para o identificador de dados personalizado que foi criado.

Para recuperar e revisar posteriormente as configurações do identificador de dados personalizado, use a GetCustomDataIdentifieroperação ou, se estiver usando o AWS CLI, execute o get-custom-data-identifiercomando. Para o id parâmetro, especifique o ID do identificador de dados personalizado.

Os exemplos a seguir mostram como usar o AWS CLI para criar um identificador de dados personalizado. Os exemplos criam um identificador de dados personalizado projetado para detectar funcionários IDs que usam uma sintaxe específica e estão próximos de uma palavra-chave específica. Os exemplos também definem configurações de severidade personalizadas para as descobertas que o identificador produz.

Este exemplo está formatado para Linux, macOS ou Unix e usa o caractere de continuação de linha “barra invertida (\)” para melhorar a legibilidade.

$ aws macie2 create-custom-data-identifier \ --name "EmployeeIDs" \ --regex "[A-Z]-\d{8}" \ --keywords '["employee","employee ID"]' \ --maximum-match-distance 20 \ --severity-levels '[{"occurrencesThreshold":1,"severity":"LOW"},{"occurrencesThreshold":50,"severity":"MEDIUM"},{"occurrencesThreshold":100,"severity":"HIGH"}]' \ --description "Detects employee IDs in proximity of a keyword." \ --tags '{"Stack":"Production"}'

Este exemplo foi formatado para Microsoft Windows e usa o caractere de continuação de linha circunflexo (^) para melhorar a legibilidade.

C:\> aws macie2 create-custom-data-identifier ^ --name "EmployeeIDs" ^ --regex "[A-Z]-\d{8}" ^ --keywords "[\"employee\",\"employee ID\"]" ^ --maximum-match-distance 20 ^ --severity-levels "[{\"occurrencesThreshold\":1,\"severity\":\"LOW\"},{\"occurrencesThreshold\":50,\"severity\":\"MEDIUM\"},{\"occurrencesThreshold\":100,\"severity\":\"HIGH\"}]" ^ --description "Detects employee IDs in proximity of a keyword." ^ --tags={\"Stack\":\"Production\"}

Em que:

  • EmployeeIDsé o nome do identificador de dados personalizado.

  • [A-Z]-\d{8}é a expressão regular para a correspondência do padrão de texto.

  • employeee employee ID são palavras-chave que devem estar próximas ao texto que corresponda ao padrão regex.

  • 20é o número máximo de caracteres que podem existir entre o final de uma palavra-chave e o final do texto que corresponde ao padrão regex.

  • descriptionespecifica uma breve descrição do identificador de dados personalizado.

  • severity-levelsdefine limites de ocorrências personalizados para a gravidade das descobertas que o identificador de dados personalizado produz: LOW para 1 a 49 ocorrências; para 50 a 99 ocorrências; e MEDIUM para 100 ou mais ocorrências. HIGH

  • Stacké a chave de tag da tag a ser atribuída ao identificador de dados personalizado. Productioné o valor da tag para a chave de tag especificada.

Siga estas etapas para criar um identificador de dados personalizado usando o console do Amazon Macie.

Para criar um identificador de dados personalizado
  1. Abra o console do Amazon Macie em. https://console.aws.amazon.com/macie/

  2. No painel de navegação, em Configurações, escolha Identificadores de dados personalizados.

  3. Escolha Criar.

  4. Para Nome insira um nome para o identificador de dados personalizado. Um nome pode conter até 128 caracteres.

  5. Em Descrição, você pode inserir uma breve descrição do identificador de dados personalizado. A descrição pode conter até 512 caracteres.

    nota

    Evite incluir dados confidenciais no nome ou na descrição de um identificador de dados personalizado. Outros usuários da sua conta podem acessar o nome ou a descrição, dependendo das ações que eles estão autorizados a realizar no Macie.

  6. Para Expressão regular, insira a expressão regular (regex) que define o padrão de texto a ser correspondido. Um nome regex pode conter até 512 caracteres.

    O Macie suporta um subconjunto da sintaxe do padrão fornecida pela biblioteca Perl Compatible Regular Expressions (PCRE). Para obter outros detalhes e dicas, consulte Critérios de detecção para identificadores de dados personalizados.

  7. Em Palavras-chave, você pode inserir até 50 sequências de caracteres (separadas por vírgulas) para definir um texto específico que deve estar próximo ao texto que corresponde ao padrão regex.

    O Macie inclui uma ocorrência nos resultados somente se o texto corresponder ao padrão regex e estiver dentro da distância máxima de correspondência de uma dessas palavras-chave. Cada palavra-chave pode conter de 3 a 90 caracteres UTF-8. Palavras-chave não diferenciam maiúsculas de minúsculas.

  8. Em Ignorar palavras, opcionalmente, insira até 10 sequências de caracteres (separadas por vírgulas) que definam um texto específico a ser excluído dos resultados.

    O Macie exclui uma ocorrência dos resultados se o texto corresponder ao padrão regex, mas contiver uma dessas palavras ignoradas. Cada palavra a ser ignorada pode conter de 4 a 90 caracteres UFT-8. Palavras ignoradas diferenciam maiúsculas de minúsculas.

  9. Em Distância máxima de correspondência, você pode inserir o número máximo de caracteres que pode existir entre o final de uma palavra-chave e o final do texto que corresponde ao padrão regex.

    O Macie inclui uma ocorrência nos resultados somente se o texto corresponder ao padrão regex e o texto estiver dentro dessa distância de uma palavra-chave completa. A distância pode ser de 1 a 300 caracteres. A distância padrão é de 50 caracteres.

  10. Em Severidade, escolha como determinar a severidade das descobertas de dados confidenciais produzidas pelo identificador de dados personalizado:

    • Para atribuir automaticamente a gravidade Média a todas as descobertas, escolha Usar gravidade Média para qualquer número de correspondências (padrão). Com essa opção, o Macie atribui automaticamente a gravidadeMédia a uma descoberta se o objeto S3 afetado contiver uma ou mais ocorrências de texto que correspondam aos critérios de detecção.

    • Para atribuir gravidade com base nos limites de ocorrências que você especificar, escolha Usar configurações personalizadas para determinar a gravidade. Em seguida, use as opções Limite de ocorrências e Nível de severidade para especificar o número mínimo de correspondências que devem existir em um objeto do S3 para produzir uma descoberta com uma severidade selecionada.

      Você pode especificar até três limites de ocorrências, um para cada nível de severidade suportado pelo Macie: Baixo (menos grave), Médio ou Alto (mais grave). Se você especificar mais de um, os limites deverão estar em ordem crescente por gravidade, de Baixo a Alto. Se um objeto do S3 contiver menos ocorrências do que o limite mais baixo, o Macie não criará uma descoberta.

  11. (Opcional) Em Tags, escolha Adicionar tag e, em seguida, insira até 50 tags para atribuir ao trabalho.

    Uma tag é um rótulo que você define e atribui a determinados tipos de AWS recursos. Cada tag consiste em uma chave de tag necessária e um valor de tag opcional. As tags podem ajudá-lo a identificar, categorizar e gerenciar recursos de diferentes maneiras, como por finalidade, proprietário, ambiente ou outros critérios. Para saber mais, consulte Marcar recursos do Macie.

  12. (Opcional) Em Avaliar, insira até 1.000 caracteres na caixa Dados da amostra e escolha Testar para testar os critérios de detecção. Macie avalia os dados da amostra e relata o número de ocorrências de texto que correspondem aos critérios. Você pode repetir essa etapa quantas vezes quiser para refinar e otimizar os critérios.

    nota

    É altamente recomendável que você teste e refine os critérios de detecção com dados de amostra. Como os identificadores de dados personalizados são usados por trabalhos confidenciais de descoberta de dados, você não pode alterar um identificador de dados personalizado depois de criá-lo. Isso ajuda a garantir que você tenha um histórico imutável de descobertas e resultados de descobertas de dados confidenciais.

  13. Quando terminar, escolha Enviar.

O Macie testa as configurações e verifica se pode compilar o regex. Se houver um problema com uma configuração ou com o regex, o Macie exibirá um erro descrevendo o que aconteceu. Depois de resolver qualquer problema, você pode salvar o identificador de dados personalizado.

Depois de criar o identificador de dados personalizado, você pode criar e configurar trabalhos de descoberta de dados confidenciais para usá-lo ou adicioná-lo às suas configurações para descoberta automática de dados confidenciais.

PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.