Para crear un identificador de datos personalizado mediante programación, utilice la CreateCustomDataIdentifieroperación de la API Amazon Macie. O bien, si está utilizando AWS Command Line Interface (AWS CLI), ejecute el comando. create-custom-data-identifier
Antes de crear un identificador de datos personalizado, le recomendamos encarecidamente que pruebe y ajuste sus criterios de detección con datos de muestra. Dado que los identificadores de datos personalizados se utilizan en los trabajos de descubrimiento de datos confidenciales, no puede cambiar un identificador de datos personalizado después de crearlo. Esto ayuda a garantizar un historial inmutable de hallazgos de datos confidenciales y resultados de descubrimiento.
Para probar los criterios mediante programación, puede utilizar el TestCustomDataIdentifierfuncionamiento de la API Amazon Macie. Esta operación proporciona un entorno para evaluar los datos de las muestras con los criterios de detección. Si utiliza el AWS CLI, puede ejecutar el test-custom-data-identifiercomando para probar los criterios.
Cuando esté listo para crear el identificador de datos personalizado, utilice los siguientes parámetros para definir sus criterios de detección:
-
regex
— Especifique la expresión regular (regex) que define el patrón de texto que debe coincidir. La expresión regular puede contener hasta 512 caracteres.
Macie admite un subconjunto de la sintaxis de patrones proporcionado por la biblioteca de expresiones regulares compatibles con Perl (PCRE). Para obtener más información y consejos, consulte Criterios de detección de los identificadores de datos personalizados.
-
keywords
— Si lo desea, especifique de 1 a 50 secuencias de caracteres (palabras clave) que deben estar cerca del texto que coincida con el patrón de expresiones regulares.
Macie incluye una aparición en los resultados solo si el texto coincide con el patrón de expresiones regulares y el texto se encuentra dentro de la distancia máxima de coincidencia de una de estas palabras clave. Cada palabra clave puede contener entre 3 y 90 caracteres UTF-8. Las palabras clave no distinguen entre mayúsculas y minúsculas.
-
maximumMatchDistance
— Si lo desea, especifique el número máximo de caracteres que pueden existir entre el final de una palabra clave y el final del texto que coincida con el patrón de expresiones regulares. Si utiliza el AWS CLI, utilice el maximum-match-distance
parámetro para especificar este valor.
Macie incluye una aparición en los resultados solo si el texto coincide con el patrón de expresiones regulares y si el texto se encuentra dentro de esta distancia de una palabra clave completa. La distancia puede ser de 1 a 300 caracteres. La distancia predeterminada es de 50 caracteres.
-
ignoreWords
— Si lo desea, especifique de 1 a 10 secuencias de caracteres (ignore las palabras) para excluirlas de los resultados. Si utiliza el AWS CLI, utilice el ignore-words
parámetro para especificar estas secuencias de caracteres.
Macie excluye una aparición de los resultados si el texto coincide con el patrón de expresiones regulares pero contiene una de estas palabras para ignorar. Cada palabra ignorada puede contener entre 4 y 90 caracteres UTF-8. Las palabras ignoradas distinguen mayúsculas de minúsculas.
Para especificar la gravedad de los hallazgos de datos confidenciales que produce el identificador de datos personalizado, utilice el severityLevels
parámetro o, si está utilizando el, el AWS CLI parámetro: severity-levels
-
Para asignar automáticamente la MEDIUM
gravedad a todos los hallazgos, omita este parámetro. A continuación, Macie utiliza la configuración por defecto. De forma predeterminada, Macie asigna la MEDIUM
gravedad a un hallazgo si el objeto S3 afectado contiene una o más apariciones de texto que coinciden con los criterios de detección.
-
Para asignar la gravedad en función de los umbrales de aparición que especifique, especifique el número mínimo de coincidencias que deben existir en un objeto de S3 para obtener un hallazgo con una gravedad específica.
Puede especificar hasta tres umbrales de incidencia, uno para cada nivel de gravedad que admita Macie: LOW
(menos grave) o HIGH
(más grave). MEDIUM
Si especifica más de uno, los umbrales deben estar en orden ascendente por gravedad, pasando de a. LOW
HIGH
Si un objeto S3 contiene menos apariciones que el umbral más bajo, Macie no crea ningún hallazgo.
Utilice parámetros adicionales para especificar un nombre y otros ajustes, como etiquetas, para el identificador de datos personalizado. Evite incluir datos confidenciales en estos ajustes. Es posible que otros usuarios de tu cuenta puedan acceder a estos valores, en función de las acciones que estén autorizados a realizar en Macie.
Al enviar la solicitud, Macie comprueba la configuración y comprueba que puede compilar la expresión regular. Si hay algún problema con una configuración o con la expresión regular, la solicitud falla y Macie devuelve un mensaje que describe el problema. Si la solicitud se realiza correctamente, recibirá un resultado similar al siguiente:
{
"customDataIdentifierId": "393950aa-82ea-4bdc-8f7b-e5be3example"
}
Donde customDataIdentifierId
especifica el identificador único (ID) del identificador de datos personalizado que se creó.
Para recuperar y revisar posteriormente la configuración del identificador de datos personalizado, utilice la GetCustomDataIdentifieroperación o, si está utilizando la AWS CLI, ejecute el get-custom-data-identifiercomando. Para el id
parámetro, especifique el ID del identificador de datos personalizado.
Los siguientes ejemplos muestran cómo utilizar el AWS CLI para crear un identificador de datos personalizado. En los ejemplos se crea un identificador de datos personalizado diseñado para detectar a los empleados IDs que utilizan una sintaxis específica y se encuentran cerca de una palabra clave específica. Los ejemplos también definen una configuración de gravedad personalizada para los hallazgos que produce el identificador.
Este ejemplo está formateado para Linux, macOS o Unix y utiliza el carácter de barra invertida (\) de continuación de línea para mejorar la legibilidad.
$
aws macie2 create-custom-data-identifier \
--name "EmployeeIDs
" \
--regex "[A-Z]-\d{8}
" \
--keywords '["employee","employee ID"
]' \
--maximum-match-distance 20
\
--severity-levels '[{"occurrencesThreshold":1
,"severity":"LOW
"},{"occurrencesThreshold":50
,"severity":"MEDIUM
"},{"occurrencesThreshold":100
,"severity":"HIGH
"}]' \
--description "Detects employee IDs in proximity of a keyword.
" \
--tags '{"Stack
":"Production
"}'
Este ejemplo está formateado para Microsoft Windows y utiliza el carácter de continuación de línea de intercalación (^) para mejorar la legibilidad.
C:\>
aws macie2 create-custom-data-identifier ^
--name "EmployeeIDs
" ^
--regex "[A-Z]-\d{8}
" ^
--keywords "[\"employee
\",\"employee ID
\"]" ^
--maximum-match-distance 20
^
--severity-levels "[{\"occurrencesThreshold\":1
,\"severity\":\"LOW
\"},{\"occurrencesThreshold\":50
,\"severity\":\"MEDIUM
\"},{\"occurrencesThreshold\":100
,\"severity\":\"HIGH
\"}]" ^
--description "Detects employee IDs in proximity of a keyword.
" ^
--tags={\"Stack
\":\"Production
\"}
Donde:
-
EmployeeIDs
es el nombre del identificador de datos personalizado.
-
[A-Z]-\d{8}
es la expresión regular con la que debe coincidir el patrón de texto.
-
employee
y employee ID
son palabras clave que deben estar cerca del texto que coincida con el patrón de expresiones regulares.
-
20
es el número máximo de caracteres que pueden existir entre el final de una palabra clave y el final del texto que coincide con el patrón de expresiones regulares.
-
description
especifica una breve descripción del identificador de datos personalizado.
-
severity-levels
define umbrales de aparición personalizados para determinar la gravedad de los hallazgos que produce el identificador de datos personalizado: LOW
de 1 a 49 casos, MEDIUM
de 50 a 99 casos y, HIGH
para 100 o más casos.
-
Stack
es la clave de etiqueta de la etiqueta que se va a asignar al identificador de datos personalizado. Production
es el valor de etiqueta de la clave de etiqueta especificada.