Per creare un identificatore di dati personalizzato a livello di codice, utilizza il CreateCustomDataIdentifierfunzionamento dell'API Amazon Macie. Oppure, se utilizzi il AWS Command Line Interface (AWS CLI), esegui il comando. create-custom-data-identifier
Prima di creare un identificatore di dati personalizzato, ti consigliamo vivamente di testarne e perfezionarne i criteri di rilevamento con dati di esempio. Poiché gli identificatori di dati personalizzati vengono utilizzati dai processi di rilevamento di dati sensibili, non è possibile modificare un identificatore di dati personalizzato dopo averlo creato. Questo aiuta a garantire una cronologia immutabile delle scoperte e delle scoperte di dati sensibili.
Per testare i criteri a livello di codice, puoi utilizzare il TestCustomDataIdentifierfunzionamento dell'API Amazon Macie. Questa operazione fornisce un ambiente per la valutazione di dati di esempio con criteri di rilevamento. Se si utilizza il AWS CLI, è possibile eseguire il test-custom-data-identifiercomando per testare i criteri.
Quando sei pronto per creare l'identificatore di dati personalizzato, utilizza i seguenti parametri per definirne i criteri di rilevamento:
-
regex
— Specificate l'espressione regolare (regex) che definisce il modello di testo da abbinare. L'espressione regolare può contenere fino a 512 caratteri.
Macie supporta un sottoinsieme della sintassi del pattern fornita dalla libreria Perl Compatible Regular Expressions (PCRE). Per ulteriori dettagli e suggerimenti, consultate Criteri di rilevamento per identificatori di dati personalizzati.
-
keywords
— Specificate facoltativamente sequenze da 1 a 50 caratteri (parole chiave) che devono trovarsi in prossimità del testo che corrisponde allo schema regex.
Macie include un'occorrenza nei risultati solo se il testo corrisponde allo schema regex e il testo si trova entro la distanza di corrispondenza massima di una di queste parole chiave. Ogni parola chiave può contenere da 3 a 90 caratteri UTF-8. Le parole chiave non distinguono tra maiuscole e minuscole.
-
maximumMatchDistance
— Specificate facoltativamente il numero massimo di caratteri che possono esistere tra la fine di una parola chiave e la fine del testo che corrisponde allo schema regex. Se si utilizza il AWS CLI, utilizzare il maximum-match-distance
parametro per specificare questo valore.
Macie include un'occorrenza nei risultati solo se il testo corrisponde allo schema regex e il testo si trova entro questa distanza da una parola chiave completa. La distanza può essere compresa tra 1 e 300 caratteri. La distanza predefinita è di 50 caratteri.
-
ignoreWords
— Specificate facoltativamente sequenze da 1 a 10 caratteri (ignorate le parole) da escludere dai risultati. Se utilizzate il AWS CLI, utilizzate il ignore-words
parametro per specificare queste sequenze di caratteri.
Macie esclude un'occorrenza dai risultati se il testo corrisponde al modello regex, ma contiene una di queste parole da ignorare. Ogni parola da ignorare può contenere da 4 a 90 caratteri UTF-8. Le parole da ignorare distinguono tra maiuscole e minuscole.
Per specificare la gravità dei dati sensibili rilevati dall'identificatore di dati personalizzato, utilizza il severityLevels
parametro o, se utilizzi il, il parametro: AWS CLIseverity-levels
-
Per assegnare automaticamente la MEDIUM
gravità a tutti i risultati, ometti questo parametro. Macie utilizza quindi l'impostazione predefinita. Per impostazione predefinita, Macie assegna la MEDIUM
gravità a un risultato se l'oggetto S3 interessato contiene una o più occorrenze di testo che corrispondono ai criteri di rilevamento.
-
Per assegnare la gravità in base alle soglie di occorrenze specificate, specifica il numero minimo di corrispondenze che devono esistere in un oggetto S3 per produrre un risultato con una gravità specificata.
È possibile specificare fino a tre soglie di occorrenza, una per ogni livello di gravità supportato da Macie: LOW
(meno grave) o (più grave). MEDIUM
HIGH
Se ne specifichi più di una, le soglie devono essere in ordine crescente per gravità, passando da a. LOW
HIGH
Se un oggetto S3 contiene un numero di occorrenze inferiore alla soglia più bassa, Macie non crea un risultato.
Utilizza parametri aggiuntivi per specificare un nome e altre impostazioni, come i tag, per l'identificatore di dati personalizzato. Evita di includere dati sensibili in queste impostazioni. Altri utenti del tuo account potrebbero essere in grado di accedere a questi valori, a seconda delle azioni che possono eseguire in Macie.
Quando invii la richiesta, Macie verifica le impostazioni e verifica che sia in grado di compilare l'espressione regolare. Se c'è un problema con un'impostazione o con l'espressione regolare, la richiesta fallisce e Macie restituisce un messaggio che descrive il problema. Se la richiesta ha esito positivo, riceverai un output simile al seguente:
{
"customDataIdentifierId": "393950aa-82ea-4bdc-8f7b-e5be3example"
}
Dove customDataIdentifierId
specifica l'identificatore univoco (ID) per l'identificatore di dati personalizzato che è stato creato.
Per recuperare e rivedere successivamente le impostazioni per l'identificatore di dati personalizzato, utilizza l'GetCustomDataIdentifieroperazione o, se utilizzi il, esegui il AWS CLI comando. get-custom-data-identifier Per il id
parametro, specifica l'ID dell'identificatore di dati personalizzato.
Gli esempi seguenti mostrano come utilizzare per AWS CLI creare un identificatore di dati personalizzato. Gli esempi creano un identificatore di dati personalizzato progettato per rilevare i dipendenti IDs che utilizzano una sintassi specifica e si trovano in prossimità di una parola chiave specificata. Gli esempi definiscono anche impostazioni di gravità personalizzate per i risultati prodotti dall'identificatore.
Questo esempio è formattato per Linux, macOS o Unix e utilizza il carattere di continuazione di barra rovesciata (\) per migliorare la leggibilità.
$
aws macie2 create-custom-data-identifier \
--name "EmployeeIDs
" \
--regex "[A-Z]-\d{8}
" \
--keywords '["employee","employee ID"
]' \
--maximum-match-distance 20
\
--severity-levels '[{"occurrencesThreshold":1
,"severity":"LOW
"},{"occurrencesThreshold":50
,"severity":"MEDIUM
"},{"occurrencesThreshold":100
,"severity":"HIGH
"}]' \
--description "Detects employee IDs in proximity of a keyword.
" \
--tags '{"Stack
":"Production
"}'
Questo esempio è formattato per Microsoft Windows e utilizza il carattere di continuazione di riga (^) per migliorare la leggibilità.
C:\>
aws macie2 create-custom-data-identifier ^
--name "EmployeeIDs
" ^
--regex "[A-Z]-\d{8}
" ^
--keywords "[\"employee
\",\"employee ID
\"]" ^
--maximum-match-distance 20
^
--severity-levels "[{\"occurrencesThreshold\":1
,\"severity\":\"LOW
\"},{\"occurrencesThreshold\":50
,\"severity\":\"MEDIUM
\"},{\"occurrencesThreshold\":100
,\"severity\":\"HIGH
\"}]" ^
--description "Detects employee IDs in proximity of a keyword.
" ^
--tags={\"Stack
\":\"Production
\"}
Dove:
-
EmployeeIDs
è il nome dell'identificatore di dati personalizzato.
-
[A-Z]-\d{8}
è l'espressione regolare per il modello di testo a cui corrispondere.
-
employee
e employee ID
sono parole chiave che devono trovarsi in prossimità del testo che corrisponde al modello regex.
-
20
è il numero massimo di caratteri che possono esistere tra la fine di una parola chiave e la fine del testo che corrisponde allo schema regex.
-
description
specifica una breve descrizione dell'identificatore di dati personalizzato.
-
severity-levels
definisce soglie di occorrenze personalizzate per la gravità dei risultati prodotti dall'identificatore di dati personalizzato: LOW
per 1-49 occorrenze, per 50-99 occorrenze e MEDIUM
per 100 o più occorrenze. HIGH
-
Stack
è la chiave del tag da assegnare all'identificatore di dati personalizzato. Production
è il valore del tag per la chiave di tag specificata.