Requisitos de palabras clave para los identificadores de datos gestionados - Amazon Macie

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Requisitos de palabras clave para los identificadores de datos gestionados

Para detectar ciertos tipos de datos confidenciales mediante identificadores de datos administrados, Amazon Macie requiere que una palabra clave esté cerca de los datos. Si este es el caso de un tipo de datos concreto, en los temas de referencia de esta sección se indican los requisitos de palabras clave para esos datos.

Si una palabra clave debe estar cerca de un tipo de datos en particular, normalmente debe estar dentro de los 30 caracteres (ambos incluidos) de los datos. Los requisitos de proximidad adicionales varían en función del tipo de archivo o el formato de almacenamiento de un objeto de Amazon Simple Storage Service (Amazon S3).

Datos estructurados y en columnas

En el caso de los datos en columnas, una palabra clave debe formar parte del mismo valor o estar en el nombre de la columna o el campo que almacena un valor. Este es el caso de los libros, CSV archivos y TSV archivos de Microsoft Excel.

Por ejemplo, si el valor de un campo contiene tanto SSNun número de nueve dígitos como un número de nueve dígitos que utiliza la sintaxis de un número de la Seguridad Social estadounidense (SSN), Macie puede detectarlo en el SSN campo. Del mismo modo, si el nombre de una columna contiene SSN, Macie puede detectar cada uno SSN de ellos en la columna. Macie considera que los valores de esa columna están cerca de la palabra clave. SSN

Datos estructurados y basados en registros

En el caso de los datos basados en registros, una palabra clave debe formar parte del mismo valor o estar en el nombre de un elemento de la ruta al campo o matriz que almacena un valor. Este es el caso de los contenedores de objetos de Apache Avro, los archivos de Apache Parquet, los JSON archivos y los archivos JSON Lines.

Por ejemplo, si el valor de un campo contiene credenciales y una secuencia de caracteres que usa la sintaxis de un AWS clave de acceso secreta, Macie puede detectar la clave en el campo. Del mismo modo, si la ruta a un campo es$.credentials.aws.key, Macie puede detectar un AWS clave de acceso secreta en el campo. Macie considera que el valor del campo está cerca de las credenciales de la palabra clave.

Datos no estructurados

No hay requisitos de proximidad adicionales para los archivos de formato de documento portátil de Adobe, los documentos de Microsoft Word, los mensajes de correo electrónico y los archivos de texto no binario que no sean CSVJSON, JSON líneas y TSV archivos. Por lo general, una palabra clave debe estar dentro de los 30 caracteres (ambos incluidos) de los datos. Esto incluye todos los datos estructurados, como las tablas, de estos tipos de archivos.

Las palabras clave no distinguen entre mayúsculas y minúsculas. Además, si una palabra clave contiene un espacio, Macie busca automáticamente las variaciones de palabras clave que no contienen el espacio o que contienen un guion bajo (_) o un guion (-) en lugar del espacio. En ciertos casos, Macie también expande o abrevia una palabra clave para tener en cuenta las variaciones comunes de esa palabra clave.

Para ver una demostración de cómo las palabras clave proporcionan contexto y ayudan a Macie a detectar tipos específicos de datos confidenciales, vea el siguiente vídeo: