Requisiti delle parole chiave per gli identificatori di dati gestiti - Amazon Macie

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Requisiti delle parole chiave per gli identificatori di dati gestiti

Per rilevare determinati tipi di dati sensibili utilizzando identificatori di dati gestiti, Amazon Macie richiede che una parola chiave si trovi in prossimità dei dati. Se questo è il caso di un particolare tipo di dati, gli argomenti di riferimento in questa sezione indicano i requisiti relativi alle parole chiave per tali dati.

Se una parola chiave deve trovarsi in prossimità di un particolare tipo di dati, in genere la parola chiave deve trovarsi entro 30 caratteri (inclusi) dai dati. I requisiti di prossimità aggiuntivi variano in base al tipo di file o al formato di archiviazione di un oggetto Amazon Simple Storage Service (Amazon S3).

Dati colonnari strutturati

Per i dati colonnari, una parola chiave deve far parte dello stesso valore o deve essere inclusa nel nome della colonna o del campo che memorizza un valore. Questo è il caso delle cartelle di lavoro di Microsoft Excel, dei file CSV e dei file TSV.

Ad esempio, se il valore di un campo contiene sia SSN che un numero a nove cifre che utilizza la sintassi di un codice di previdenza sociale statunitense (SSN), Macie è in grado di rilevare l'SSN nel campo. Analogamente, se il nome di una colonna contiene SSN, Macie è in grado di rilevare ogni SSN nella colonna. Macie considera i valori in quella colonna come se fossero in prossimità della parola chiave SSN.

Dati strutturati basati su record

Per i dati basati sui record, una parola chiave deve far parte dello stesso valore o essere inclusa nel nome di un elemento nel percorso del campo o dell'array che memorizza un valore. Questo è il caso dei contenitori di oggetti Apache Avro, dei file Apache Parquet, dei file JSON e dei file JSON Lines.

Ad esempio, se il valore di un campo contiene sia credenziali che una sequenza di caratteri che utilizza la sintassi di una chiave di accesso AWS segreta, Macie può rilevare la chiave nel campo. Allo stesso modo, se il percorso di un campo è$.credentials.aws.key, Macie può rilevare una chiave di accesso AWS segreta nel campo. Macie considera il valore nel campo come se fosse in prossimità delle credenziali della parola chiave.

Dati non strutturati

Per i dati non strutturati, una parola chiave deve in genere trovarsi entro 30 caratteri (inclusi) dai dati. Non ci sono requisiti di prossimità aggiuntivi. È il caso dei file Adobe Portable Document Format, dei documenti Microsoft Word, dei messaggi di posta elettronica e dei file di testo non binari diversi dai file CSV, JSON, JSON Lines e TSV. Ciò include tutti i dati strutturati, come tabelle o XML, in questi tipi di file.

Le parole chiave non distinguono tra maiuscole e minuscole. Inoltre, se una parola chiave contiene uno spazio, Macie corrisponde automaticamente alle varianti di parola chiave che non contengono lo spazio o contengono un carattere di sottolineatura (_) o un trattino (-) anziché lo spazio. In alcuni casi, Macie amplia o abbrevia anche una parola chiave per rispondere alle varianti più comuni della parola chiave.

Per una dimostrazione di come le parole chiave forniscano un contesto e aiutino Macie a rilevare tipi specifici di dati sensibili, guarda il seguente video: