Criar um identificador de dados personalizado - Amazon Macie

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Criar um identificador de dados personalizado

Um identificador de dados personalizado é um conjunto de critérios que você define para detectar dados confidenciais em objetos do Amazon Simple Storage Service (Amazon S3). Ao criar um identificador de dados personalizado, você especifica uma expressão regular (regex) que define um padrão de texto para corresponder em um objeto do S3. Você também pode especificar sequências de caracteres e uma regra de proximidade que refina os resultados. As sequências de caracteres podem ser: palavras-chave, que são palavras ou frases que devem estar próximas ao texto que corresponda ao regex, ou ignorar palavras, que são palavras ou frases a serem excluídas dos resultados. Ao usar identificadores de dados personalizados, você pode complementar os identificadores de dados gerenciados que o Amazon Macie fornece e detectar dados confidenciais que reflitam os cenários, a propriedade intelectual ou os dados proprietários específicos da sua organização.

Por exemplo, muitas empresas têm uma sintaxe específica para funcionáriosIDs. Uma dessas sintaxes pode ser: uma letra maiúscula que indica se um funcionário é funcionário em tempo integral (F) ou meio período (P), seguida por um hífen (—), seguido por uma sequência de oito dígitos que identifica o funcionário. Os exemplos são: F—12345678, para um funcionário em tempo integral, e P—87654321, para um funcionário em tempo parcial. Se você criar um identificador de dados personalizado para detectar funcionários IDs que usam essa sintaxe, você pode usar o seguinte regex:. [A-Z]-\d{8} Para refinar a análise e evitar falsos positivos, você também pode configurar o identificador para usar palavras-chave (employeeeemployee ID) e uma distância máxima de correspondência de 20 caracteres. Com esses critérios, os resultados incluem texto que corresponda ao regex somente se o texto ocorrer após a palavra-chave funcionário ou ID do funcionário e todo o texto ocorrer dentro de 20 caracteres de uma dessas palavras-chave.

Para ver uma demonstração de como as palavras-chave podem ajudar você a encontrar dados confidenciais e evitar falsos positivos, assista ao vídeo a seguir:

Além dos critérios de detecção, você pode, opcionalmente, especificar configurações de severidade personalizadas para descobertas que um identificador de dados personalizado produz. A severidade pode ser baseada no número de ocorrências de texto que correspondem aos critérios de detecção do identificador. Se você não especificar essas configurações, o Macie atribuirá automaticamente a severidade média a todas as descobertas que o identificador produz. A gravidade não muda com base no número de ocorrências de texto que correspondem aos critérios de detecção do identificador.

Para obter informações detalhadas sobre essas e outras configurações, consulteOpções de configuração para identificadores de dados personalizados.

Para criar um identificador de dados personalizado

Siga estas etapas para criar um identificador de dados personalizado usando o console do Amazon Macie. Para criar um identificador de dados personalizado de forma programática, use a CreateCustomDataIdentifieroperação do Amazon Macie. API

  1. Abra o console do Amazon Macie em. https://console.aws.amazon.com/macie/

  2. No painel de navegação, em Configurações, escolha Identificadores de dados personalizados.

  3. Escolha Criar.

  4. Para Nome insira um nome para o identificador de dados personalizado. Um nome pode conter até 128 caracteres.

  5. Em Descrição, opcionalmente, insira uma breve descrição do identificador de dados personalizado. A descrição pode conter até 512 caracteres.

    nota

    Evite incluir dados confidenciais no nome ou na descrição de um identificador de dados personalizado. Outros usuários da sua conta podem ver o nome ou a descrição, dependendo das ações que eles estão autorizados a realizar no Macie.

  6. Para a Regular expression, insira a expressão regular (regex) que define o padrão de texto a ser correspondido. Um nome regex pode conter até 512 caracteres.

    O Macie suporta um subconjunto da sintaxe padrão fornecida pela biblioteca Perl Compatible Regular Expressions (). PCRE Para obter detalhes e dicas adicionais, consulte Critérios de detecção para identificadores de dados personalizados.

  7. Em Palavras-chave, opcionalmente, insira até 50 sequências de caracteres (separadas por vírgulas) para definir um texto específico que deve estar próximo ao texto que corresponda ao padrão regex.

    O Macie inclui uma ocorrência nos resultados somente se o texto corresponder ao padrão regex e estiver dentro da distância máxima de correspondência de uma dessas palavras-chave. Cada palavra-chave pode conter de 3 a 90 a 8 caracteresUTF. Palavras-chave não diferenciam maiúsculas de minúsculas.

  8. Em Ignorar palavras, opcionalmente, insira até 10 sequências de caracteres (separadas por vírgulas) que definam um texto específico a ser excluído dos resultados.

    O Macie exclui uma ocorrência dos resultados se o texto corresponder ao padrão regex, mas contiver uma dessas palavras ignoradas. Cada palavra ignorada pode conter de 4 a 90 a 8 caracteresUTF. Palavras ignoradas diferenciam maiúsculas de minúsculas.

  9. Em Distância máxima de correspondência, opcionalmente, insira o número máximo de caracteres que podem existir entre o final de uma palavra-chave e o final do texto que corresponde ao padrão regex.

    O Macie inclui uma ocorrência nos resultados somente se o texto corresponder ao padrão regex e o texto estiver dentro dessa distância de uma palavra-chave completa. A distância pode ser de 1 a 300 caracteres. A distância padrão é de 50 caracteres.

  10. Em Severidade, escolha como determinar a gravidade das descobertas de dados confidenciais que o identificador de dados personalizado produz:

    • Para atribuir automaticamente a gravidade Média a todas as descobertas, escolha Usar gravidade Média para qualquer número de correspondências (padrão). Com essa opção, o Macie atribui automaticamente a gravidadeMédia a uma descoberta se o objeto S3 afetado contiver uma ou mais ocorrências de texto que correspondam aos critérios de detecção.

    • Para atribuir gravidade com base nos limites de ocorrências que você especificar, escolha Usar configurações personalizadas para determinar a gravidade. Em seguida, use as opções Limite de ocorrências e Nível de gravidade para especificar o número mínimo de correspondências que devem existir em um objeto do S3 para produzir uma descoberta com uma gravidadeselecionada.

      Você pode especificar até três limites de ocorrências, um para cada nível de severidade suportado pelo Macie: Baixo (menos grave), Médio ou Alto (mais grave). Se você especificar mais de um, os limites deverão estar em ordem crescente por gravidade, de Baixo a Alto. Se um objeto do S3 contiver menos ocorrências do que o limite mais baixo de ocorrências, o Macie não criará uma descoberta.

  11. (Opcional) Em Tags, escolha Adicionar tag e, em seguida, insira até 50 tags para atribuir ao trabalho.

    Uma tag é um rótulo que você define e atribui a determinados tipos de AWS recursos. Cada tag consiste em uma chave de tag necessária e um valor de tag opcional. As tags podem ajudá-lo a identificar, categorizar e gerenciar recursos de diferentes maneiras, como por finalidade, proprietário, ambiente ou outros critérios. Para saber mais, consulte Marcando recursos do Macie.

  12. (Opcional) Em Avaliar, insira até 1.000 caracteres na caixa Dados da amostra e escolha Testar para testar os critérios de detecção. Macie avalia os dados da amostra e relata o número de ocorrências de texto que correspondem aos critérios. Você pode repetir essa etapa quantas vezes quiser para refinar e otimizar os critérios.

    nota

    Recomendamos enfaticamente que você teste e refine os critérios de detecção antes de salvar o identificador de dados personalizado. Como identificadores de dados personalizados são usados por trabalhos confidenciais de descoberta de dados, não é possível editar um identificador de dados personalizado depois de salvá-lo. Isso ajuda a garantir que você tenha um histórico imutável de descobertas de dados sigilosos e resultados de descoberta para auditorias de privacidade de dados e proteção de dados ou investigações que você realiza.

  13. Quando terminar, escolha Enviar.

O Macie testa as configurações e verifica se ele pode compilar o regex. Se houver um problema com uma configuração ou com o regex, o Macie exibirá um erro que descreve o problema. Depois de resolver qualquer problema, você pode salvar o identificador de dados personalizado. Em seguida, você pode criar e configurar trabalhos de descoberta de dados confidenciais para usar o identificador ou adicionar o identificador às suas configurações para descoberta automática de dados confidenciais.