Schema per la segnalazione della posizione dei dati sensibili - Amazon Macie

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Schema per la segnalazione della posizione dei dati sensibili

Amazon Macie utilizza JSON strutture standardizzate per archiviare informazioni su dove trova dati sensibili negli oggetti Amazon Simple Storage Service (Amazon S3). Le strutture vengono utilizzate per la rilevazione di dati sensibili e per i risultati della scoperta di dati sensibili. Per i risultati di dati sensibili, le strutture fanno parte dello JSON schema per i risultati. Per esaminare lo JSON schema completo dei risultati, consulta Findings in Amazon Macie API Reference. Per ulteriori informazioni sui risultati della scoperta di dati sensibili, consultaArchiviazione e mantenimento dei risultati di rilevamento dei dati sensibili.

Panoramica dello schema

Per segnalare la posizione dei dati sensibili che Amazon Macie ha trovato in un oggetto S3 interessato, JSON lo schema per il rilevamento dei dati sensibili e i risultati del rilevamento dei dati sensibili include un customDataIdentifiers oggetto e un oggetto. sensitiveData L'customDataIdentifiersoggetto fornisce dettagli sui dati rilevati da Macie utilizzando identificatori di dati personalizzati. L'sensitiveDataoggetto fornisce dettagli sui dati rilevati da Macie utilizzando identificatori di dati gestiti.

Ogni customDataIdentifiers sensitiveData oggetto contiene uno o più detections array:

  • In un customDataIdentifiers oggetto, l'detectionsarray indica quali identificatori di dati personalizzati hanno rilevato i dati e prodotto il risultato. Per ogni identificatore di dati personalizzato, l'array indica anche il numero di occorrenze dei dati rilevati dall'identificatore. Può anche indicare la posizione dei dati rilevati dall'identificatore.

  • In un sensitiveData oggetto, un detections array indica i tipi di dati sensibili rilevati da Macie utilizzando identificatori di dati gestiti. Per ogni tipo di dati sensibili, l'array indica anche il numero di occorrenze dei dati e può indicare la posizione dei dati.

Per la ricerca di dati sensibili, un detections array può includere da 1 occurrences a 15 oggetti. Ogni occurrences oggetto specifica dove Macie ha rilevato le singole occorrenze di un tipo specifico di dati sensibili.

Ad esempio, l'detectionsarray seguente indica la posizione di tre occorrenze di dati sensibili (numeri di previdenza sociale degli Stati Uniti) che Macie ha trovato in un file. CSV

"sensitiveData": [ { "category": "PERSONAL_INFORMATION", "detections": [ { "count": 30, "occurrences": { "cells": [ { "cellReference": null, "column": 1, "columnName": "SSN", "row": 2 }, { "cellReference": null, "column": 1, "columnName": "SSN", "row": 3 }, { "cellReference": null, "column": 1, "columnName": "SSN", "row": 4 } ] }, "type": "USA_SOCIAL_SECURITY_NUMBER" }

La posizione e il numero di occurrences oggetti in un detections array variano in base alle categorie, ai tipi e al numero di occorrenze di dati sensibili rilevati da Macie durante un ciclo di analisi automatizzato di rilevamento di dati sensibili o l'esecuzione di un processo di rilevamento di dati sensibili. Per ogni ciclo di analisi o processo eseguito, Macie utilizza un algoritmo di ricerca basato sulla profondità per compilare i risultati risultanti con i dati sulla posizione per 1-15 occorrenze di dati sensibili che Macie rileva negli oggetti S3. Queste occorrenze sono indicative delle categorie e dei tipi di dati sensibili che un bucket e un oggetto S3 interessati potrebbero contenere.

Un occurrences oggetto può contenere una delle seguenti strutture, a seconda del tipo di file o del formato di archiviazione dell'oggetto S3 interessato:

  • cellsarray: questo array si applica alle cartelle di lavoro, ai file e CSV TSV ai file di Microsoft Excel. Un oggetto in questo array specifica una cella o un campo in cui Macie ha rilevato una presenza di dati sensibili.

  • lineRangesarray: questo array si applica ai file di messaggi di posta elettronica (EML) e ai file di testo non binari diversi da CSVJSON, JSON righe e TSV file, ad esempio, e file. HTML TXT XML Un oggetto in questo array specifica una riga o un intervallo di righe inclusivo in cui Macie ha rilevato la presenza di dati sensibili e la posizione dei dati sulla riga o sulle righe specificate.

    In alcuni casi, un oggetto in un lineRanges array specifica la posizione del rilevamento di dati sensibili in un tipo di file o formato di archiviazione supportato da un altro tipo di array. Questi casi sono: un rilevamento in una sezione non strutturata di un file altrimenti strutturato, ad esempio un commento in un file; un rilevamento in un file non valido che Macie analizza come testo normale; e un TSV file CSV or che ha uno o più nomi di colonna in cui Macie ha rilevato dati sensibili.

  • offsetRangesarray — Questo array è riservato per utilizzi futuri. Se questo array è presente, il suo valore è nullo.

  • pagesarray: questo array si applica ai file Adobe Portable Document Format (PDF). Un oggetto in questo array specifica una pagina in cui Macie ha rilevato una presenza di dati sensibili.

  • recordsarray: questo array si applica ai contenitori di oggetti Apache Avro, ai file Apache Parquet, ai file e ai file LinesJSON. JSON Per i contenitori di oggetti Avro e i file Parquet, un oggetto in questo array specifica un indice di record e il percorso di un campo in un record in cui Macie ha rilevato una presenza di dati sensibili. Per i file JSON and JSON Lines, un oggetto in questo array specifica il percorso di un campo o di un array in cui Macie ha rilevato la presenza di dati sensibili. Per i file JSON Lines, specifica anche l'indice della riga che contiene i dati.

Il contenuto di questi array varia in base al tipo di file o al formato di archiviazione dell'oggetto S3 interessato e al relativo contenuto.

Dettagli ed esempi dello schema

Amazon Macie personalizza i contenuti delle JSON strutture utilizzate per indicare dove ha rilevato dati sensibili in tipi specifici di file e contenuti. I seguenti argomenti spiegano e forniscono esempi di queste strutture.

Per un elenco completo delle JSON strutture che possono essere incluse in una ricerca di dati sensibili, consulta Findings in the Amazon Macie API Reference.

Matrice di celle

Si applica a: cartelle di lavoro, CSV file e TSV file di Microsoft Excel

In un cells array, un Cell oggetto specifica una cella o un campo in cui Macie ha rilevato una presenza di dati sensibili. La tabella seguente descrive lo scopo di ogni campo in un Cell oggetto.

Campo Type Descrizione
cellReference Stringa La posizione della cella, come riferimento assoluto, che contiene l'occorrenza. Questo campo si applica solo alle cartelle di lavoro di Excel. Questo valore è nullo per i file CSV andTSV.
column Numero intero Il numero di colonna della colonna che contiene l'occorrenza. Per una cartella di lavoro di Excel, questo valore è correlato ai caratteri alfabetici di un identificatore di colonna, ad esempio per la colonna A, 1 per la colonna B e così 2 via.
columnName Stringa Il nome della colonna che contiene l'occorrenza, se disponibile.
row Numero intero Il numero di riga della riga che contiene l'occorrenza.

L'esempio seguente mostra la struttura di un Cell oggetto che specifica la posizione di un'occorrenza di dati sensibili rilevati da Macie in un CSV file.

"cells": [ { "cellReference": null, "column": 3, "columnName": "SSN", "row": 5 } ]

Nell'esempio precedente, la scoperta indica che Macie ha rilevato dati sensibili nel campo nella quinta riga della terza colonna (denominata SSN) del file.

L'esempio seguente mostra la struttura di un Cell oggetto che specifica la posizione di un'occorrenza di dati sensibili rilevati da Macie in una cartella di lavoro di Excel.

"cells": [ { "cellReference": "Sheet2!C5", "column": 3, "columnName": "SSN", "row": 5 } ]

Nell'esempio precedente, la scoperta indica che Macie ha rilevato dati sensibili nel foglio di lavoro denominato Sheet2 della cartella di lavoro. In quel foglio di lavoro, Macie ha rilevato dati sensibili nella cella nella quinta riga della terza colonna (colonna C, denominata). SSN

LineRangesmatrice

Si applica a: file di messaggi di posta elettronica (EML) e file di testo non binari diversi CSV da JSON righe e TSV file, ad esempio, e file JSON HTML TXT XML

In un lineRanges array, un Range oggetto specifica una riga o un intervallo di righe inclusivo in cui Macie ha rilevato la presenza di dati sensibili e la posizione dei dati sulla riga o sulle righe specificate.

Questo oggetto è spesso vuoto per i tipi di file supportati da altri tipi di matrici negli oggetti. occurrences Le eccezioni sono:

  • Dati in sezioni non strutturate di un file altrimenti strutturato, ad esempio un commento in un file.

  • Dati in un file in formato errato che Macie analizza come testo non crittografato.

  • Un TSV file CSV o con uno o più nomi di colonna in cui Macie ha rilevato dati sensibili.

La tabella seguente descrive lo scopo di ogni campo in un Range oggetto di un lineRanges array.

Campo Type Descrizione
end Numero intero Il numero di righe dall'inizio del file alla fine dell'occorrenza.
start Numero intero Il numero di righe dall'inizio del file all'inizio dell'occorrenza.
startColumn Numero intero Il numero di caratteri, con spazi e a partire da 1, dall'inizio della prima riga che contiene l'occorrenza (start) all'inizio dell'occorrenza.

L'esempio seguente mostra la struttura di un Range oggetto che specifica la posizione di un'occorrenza di dati sensibili rilevati da Macie su una singola riga di un TXT file.

"lineRanges": [ { "end": 1, "start": 1, "startColumn": 119 } ]

Nell'esempio precedente, la scoperta indica che Macie ha rilevato una presenza completa di dati sensibili (un indirizzo postale) nella prima riga del file. Il primo carattere dell'occorrenza corrisponde a 119 caratteri (con spazi) dall'inizio di quella riga.

L'esempio seguente mostra la struttura di un Range oggetto che specifica la posizione di un'occorrenza di dati sensibili che si estende su più righe in un TXT file.

"lineRanges": [ { "end": 54, "start": 51, "startColumn": 1 } ]

Nell'esempio precedente, la scoperta indica che Macie ha rilevato una presenza di dati sensibili (un indirizzo postale) compresi tra le righe da 51 a 54 del file. Il primo carattere dell'occorrenza è il primo carattere sulla riga 51 del file.

Matrice di pagine

Si applica a: file Adobe Portable Document Format () PDF

In un pages array, un Page oggetto specifica una pagina in cui Macie ha rilevato una presenza di dati sensibili. L'oggetto contiene un pageNumber campo. Il pageNumber campo memorizza un numero intero che specifica il numero di pagina della pagina che contiene l'occorrenza.

L'esempio seguente mostra la struttura di un Page oggetto che specifica la posizione di un'occorrenza di dati sensibili rilevati da Macie in un file. PDF

"pages": [ { "pageNumber": 10 } ]

Nell'esempio precedente, il risultato indica che la pagina 10 del file contiene l'occorrenza.

Matrice di record

Si applica a: contenitori di oggetti Apache Avro, file Apache Parquet, file e file Lines JSON JSON

Per un contenitore di oggetti Avro o un file Parquet, un Record oggetto in un records array specifica un indice di record e il percorso di un campo in un record in cui Macie ha rilevato una presenza di dati sensibili. Per i file JSON and JSON Lines, un Record oggetto specifica il percorso di un campo o di un array in cui Macie ha rilevato una presenza di dati sensibili. Per i file JSON Lines, specifica anche l'indice della riga che contiene l'occorrenza.

La tabella seguente descrive lo scopo di ogni campo in un Record oggetto.

Campo Type Descrizione
jsonPath Stringa

Il percorso, come JSONPath espressione, dell'occorrenza.

Per un contenitore di oggetti Avro o un file Parquet, questo è il percorso del campo nel record (recordIndex) che contiene l'occorrenza. Per un file JSON o JSON Lines, questo è il percorso del campo o dell'array che contiene l'occorrenza. Se i dati sono un valore in una matrice, il percorso indica anche quale valore contiene l'occorrenza.

Se Macie rileva dati sensibili nel nome di qualsiasi elemento del percorso, Macie omette il jsonPath campo da un oggetto. Record Se il nome di un elemento del percorso supera i 240 caratteri, Macie tronca il nome rimuovendo i caratteri dall'inizio del nome. Se il percorso completo risultante supera i 250 caratteri, Macie tronca anche il percorso, a partire dal primo elemento del percorso, finché il percorso non contiene 250 caratteri o meno.

recordIndex Numero intero Per un contenitore di oggetti Avro o un file Parquet, l'indice dei record, a partire da 0, per il record che contiene l'occorrenza. Per un file JSON Lines, l'indice di riga, a partire da 0, per la riga che contiene l'occorrenza. Questo valore è sempre valido 0 per JSON i file.

L'esempio seguente mostra la struttura di un Record oggetto che specifica la posizione di un'occorrenza di dati sensibili rilevati da Macie in un file Parquet.

"records": [ { "jsonPath": "$['abcdefghijklmnopqrstuvwxyz']", "recordIndex": 7663 } ]

Nell'esempio precedente, la scoperta indica che Macie ha rilevato dati sensibili nel record dell'indice 7663 (numero di record 7664). In quel record, Macie ha rilevato dati sensibili nel campo denominato. abcdefghijklmnopqrstuvwxyz Il JSON percorso completo del campo nel record è$.abcdefghijklmnopqrstuvwxyz. Il campo è un discendente diretto dell'oggetto radice (di livello esterno).

L'esempio seguente mostra anche la struttura di un Record oggetto per un'occorrenza di dati sensibili rilevati da Macie in un file Parquet. Tuttavia, in questo esempio, Macie ha troncato il nome del campo che contiene l'occorrenza perché il nome supera il limite di caratteri.

"records": [ { "jsonPath": "$['...uvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz']", "recordIndex": 7663 } ]

Nell'esempio precedente, il campo è un discendente diretto dell'oggetto radice (di livello esterno).

Nell'esempio seguente, sempre per un'occorrenza di dati sensibili rilevata da Macie in un file Parquet, Macie ha troncato il percorso completo del campo che contiene l'occorrenza. Il percorso completo supera il limite di caratteri.

"records": [ { "jsonPath": "$..usssn2.usssn3.usssn4.usssn5.usssn6.usssn7.usssn8.usssn9.usssn10.usssn11.usssn12.usssn13.usssn14.usssn15.usssn16.usssn17.usssn18.usssn19.usssn20.usssn21.usssn22.usssn23.usssn24.usssn25.usssn26.usssn27.usssn28.usssn29['abcdefghijklmnopqrstuvwxyz']", "recordIndex": 2335 } ]

Nell'esempio precedente, il risultato indica che Macie ha rilevato dati sensibili nel record dell'indice 2335 (numero di record 2336). In quel record, Macie ha rilevato dati sensibili nel campo denominato. abcdefghijklmnopqrstuvwxyz Il JSON percorso completo del campo nel record è:

$['1234567890']usssn1.usssn2.usssn3.usssn4.usssn5.usssn6.usssn7.usssn8.usssn9.usssn10.usssn11.usssn12.usssn13.usssn14.usssn15.usssn16.usssn17.usssn18.usssn19.usssn20.usssn21.usssn22.usssn23.usssn24.usssn25.usssn26.usssn27.usssn28.usssn29['abcdefghijklmnopqrstuvwxyz']

L'esempio seguente mostra la struttura di un Record oggetto che specifica la posizione di un'occorrenza di dati sensibili rilevati da Macie in un JSON file. In questo esempio, l'occorrenza è un valore specifico in una matrice.

"records": [ { "jsonPath": "$.access.key[2]", "recordIndex": 0 } ]

Nell'esempio precedente, il risultato indica che Macie ha rilevato dati sensibili nel secondo valore di un array denominato. key L'array è un elemento secondario di un oggetto denominato. access

L'esempio seguente mostra la struttura di un Record oggetto che specifica la posizione di un'occorrenza di dati sensibili rilevati da Macie in un JSON file Lines.

"records": [ { "jsonPath": "$.access.key", "recordIndex": 3 } ]

Nell'esempio precedente, la scoperta indica che Macie ha rilevato dati sensibili nel terzo valore (riga) del file. In quella riga, l'occorrenza si trova in un campo denominatokey, che è un elemento secondario di un oggetto denominato. access