Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Skema untuk melaporkan lokasi data sensitif
Amazon Macie menggunakan JSON struktur standar untuk menyimpan informasi tentang di mana ia menemukan data sensitif di objek Amazon Simple Storage Service (Amazon S3). Struktur digunakan oleh temuan data sensitif dan hasil penemuan data sensitif. Untuk temuan data sensitif, struktur adalah bagian dari JSON skema temuan. Untuk meninjau JSON skema lengkap untuk temuan, lihat Temuan di Referensi Amazon API Macie. Untuk mempelajari selengkapnya tentang hasil penemuan data sensitif, lihat Menyimpan dan mempertahankan hasil penemuan data sensitif.
Ikhtisar skema
Untuk melaporkan lokasi data sensitif yang ditemukan Amazon Macie di objek S3 yang terpengaruh, JSON skema untuk temuan data sensitif dan hasil penemuan data sensitif mencakup satu customDataIdentifiers
objek dan satu objek. sensitiveData
customDataIdentifiers
Objek memberikan detail tentang data yang dideteksi Macie menggunakan pengidentifikasi data khusus. sensitiveData
Objek memberikan rincian tentang data yang dideteksi Macie menggunakan pengidentifikasi data terkelola.
Setiap objek customDataIdentifiers
dan sensitiveData
berisi satu arraydetections
atau lebih:
-
Dalam sebuah
customDataIdentifiers
objek,detections
array menunjukkan pengidentifikasi data kustom mana yang mendeteksi data dan menghasilkan temuan. Untuk setiap pengidentifikasi data kustom, array juga menunjukkan jumlah kejadian data yang dideteksi pengidentifikasi. Array tersebut juga dapat menunjukkan lokasi data yang terdeteksi oleh pengenal. -
Pada objek
sensitiveData
, arraydetections
yang menunjukkan tipe data sensitif yang Macie deteksi menggunakan pengidentifikasi data terkelola. Untuk setiap tipe data sensitif, array juga menunjukkan jumlah kejadian dari data, dan dapat menunjukkan lokasi data.
Untuk temuan data sensitif, array detections
dapat mencakup 1-15 objek occurrences
. Setiap occurrences
objek menentukan di mana Macie mendeteksi kejadian individu dari jenis data sensitif tertentu.
Misalnya, detections
larik berikut menunjukkan lokasi tiga kejadian data sensitif (nomor Jaminan Sosial AS) yang ditemukan Macie dalam file. CSV
"sensitiveData": [
{
"category": "PERSONAL_INFORMATION",
"detections": [
{
"count": 30,
"occurrences": {
"cells": [
{
"cellReference": null,
"column": 1,
"columnName": "SSN",
"row": 2
},
{
"cellReference": null,
"column": 1,
"columnName": "SSN",
"row": 3
},
{
"cellReference": null,
"column": 1,
"columnName": "SSN",
"row": 4
}
]
},
"type": "USA_SOCIAL_SECURITY_NUMBER"
}
Lokasi dan jumlah occurrences
objek dalam detections
array bervariasi berdasarkan kategori, jenis, dan jumlah kejadian data sensitif yang dideteksi Macie selama siklus analisis penemuan data sensitif otomatis atau menjalankan pekerjaan penemuan data sensitif. Untuk setiap siklus analisis atau menjalankan pekerjaan, Macie menggunakan algoritme pencarian kedalaman pertama untuk mengisi temuan yang dihasilkan dengan data lokasi untuk 1-15 kemunculan data sensitif yang dideteksi Macie di objek S3. Kejadian ini menunjukkan kategori dan jenis data sensitif yang mungkin berisi bucket dan objek S3 yang terpengaruh.
occurrences
Objek dapat berisi struktur berikut, tergantung pada jenis file atau format penyimpanan objek S3 yang terpengaruh:
-
cells
array - Array ini berlaku untuk buku kerja, CSV file, dan TSV file Microsoft Excel. Objek dalam array ini menentukan sel atau bidang yang Macie mendeteksi terjadinya data sensitif. -
lineRanges
array — Array ini berlaku untuk file pesan email (EML), dan file teks non-biner selainCSV,, JSON GarisJSON, dan TSV file — misalnya,,HTML, TXT dan file. XML Objek dalam larik ini menentukan garis atau rentang garis inklusif tempat Macie mendeteksi terjadinya data sensitif, dan posisi data pada garis atau garis yang ditentukan.Dalam kasus tertentu, objek dalam
lineRanges
array menentukan lokasi deteksi data sensitif dalam jenis file atau format penyimpanan yang didukung oleh jenis array lain. Kasus-kasus tersebut adalah: deteksi di bagian tidak terstruktur dari file yang terstruktur, seperti komentar dalam file; deteksi dalam file cacat yang dianalisis Macie sebagai plaintext; dan, TSV file CSV atau yang memiliki satu atau lebih nama kolom tempat Macie mendeteksi data sensitif. -
Array
offsetRanges
- Array ini dicadangkan untuk penggunaan di waktu yang akan datang. Jika array ini hadir, nilai untuk itu adalah null. -
pages
array - Array ini berlaku untuk file Adobe Portable Document Format (PDF). Sebuah objek dalam array ini menentukan halaman yang Macie mendeteksi terjadinya data sensitif di. -
records
array - Array ini berlaku untuk wadah objek Apache Avro, file Apache Parquet, file, dan file JSON Lines. JSON Untuk wadah objek Avro dan file Parket, objek dalam array ini menentukan indeks rekaman dan jalur ke bidang dalam catatan yang Macie mendeteksi terjadinya data sensitif. Untuk JSON dan JSON Lines file, objek dalam array ini menentukan jalur ke bidang atau array yang Macie mendeteksi terjadinya data sensitif di. Untuk file JSON Lines, ini juga menentukan indeks baris yang berisi data.
Isi dari susunan ini bervariasi berdasarkan tipe file atau format penyimpanan objek S3 terpengaruh dan isinya.
Detail skema dan contoh
Amazon Macie menyesuaikan konten JSON struktur yang digunakannya untuk menunjukkan di mana ia mendeteksi data sensitif dalam jenis file dan konten tertentu. Topik berikut menjelaskan dan memberikan contoh struktur ini.
Untuk daftar lengkap JSON struktur yang dapat disertakan dalam temuan data sensitif, lihat Temuan di Referensi Amazon Macie API.
Cell array
Berlaku untuk: Buku kerja, CSV file, dan TSV file Microsoft Excel
Dalam cells
array, Cell
objek menentukan sel atau bidang yang Macie mendeteksi terjadinya data sensitif di. Tabel berikut menjelaskan tujuan masing-masing bidang dalam objek Cell
.
Bidang | Tipe | Deskripsi |
---|---|---|
cellReference |
String | Lokasi sel, sebagai referensi sel absolut, yang berisi kejadian. Bidang ini hanya berlaku untuk buku kerja Excel. Nilai ini adalah null for CSV dan TSV file. |
column |
Bilangan Bulat | Nomor kolom kolom yang berisi kejadian. Untuk buku kerja Excel, nilai ini berkorelasi dengan karakter abjad (-abjad) untuk pengidentifikasi kolom — misalnya, 1 untuk kolom A, 2 untuk kolom B, dan seterusnya. |
columnName |
String | Nama kolom yang berisi kejadian, jika tersedia. |
row |
Bilangan Bulat | Nomor baris baris yang berisi kejadian. |
Contoh berikut menunjukkan struktur Cell
objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam file. CSV
"cells": [
{
"cellReference": null,
"column": 3,
"columnName": "SSN",
"row": 5
}
]
Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif di bidang di baris kelima dari kolom ketiga (bernama SSN) file.
Contoh berikut menunjukkan struktur Cell
objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam buku kerja Excel.
"cells": [
{
"cellReference": "Sheet2!C5",
"column": 3,
"columnName": "SSN",
"row": 5
}
]
Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif di lembar kerja bernama Sheet2 di buku kerja. Di lembar kerja itu, Macie mendeteksi data sensitif di sel di baris kelima kolom ketiga (kolom C, bernama SSN).
LineRangesarray
Berlaku untuk: File pesan email (EML), dan file teks non-biner selainCSV,, JSON BarisJSON, dan TSV file — misalnya,,, HTML dan file TXT XML
Dalam lineRanges
array, Range
objek menentukan garis atau rentang garis inklusif tempat Macie mendeteksi terjadinya data sensitif, dan posisi data pada garis atau garis yang ditentukan.
Objek ini sering kosong demi tipe file yang didukung oleh tipe lain dari susunan di objek occurrences
. Pengecualian nya adalah:
-
Data di bagian yang tidak terstruktur dari file lain yang terstruktur, seperti komentar dalam file.
-
Data dalam file cacat ketika Macie menganalisisnya sebagai plaintext.
-
Sebuah CSV atau TSV file yang memiliki satu atau beberapa nama kolom tempat Macie mendeteksi data sensitif.
Tabel berikut menjelaskan tujuan masing-masing bidang dalam Objek Range
dari objek susunan lineRanges
.
Bidang | Tipe | Deskripsi |
---|---|---|
end |
Bilangan Bulat | Jumlah baris dari awal file hingga akhir kejadian. |
start |
Bilangan Bulat | Jumlah baris dari awal file hingga awal kejadian. |
startColumn |
Bilangan Bulat | Jumlah karakter, dengan spasi dan mulai dari 1, dari awal baris pertama yang berisi kejadian (start ) hingga awal terjadinya. |
Contoh berikut menunjukkan struktur Range
objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi pada satu baris dalam file. TXT
"lineRanges": [
{
"end": 1,
"start": 1,
"startColumn": 119
}
]
Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi kejadian lengkap data sensitif (alamat surat) di baris pertama file. Karakter pertama dalam kejadian adalah 119 karakter (dengan spasi) dimulai dari awal baris itu.
Contoh berikut menunjukkan struktur Range
objek yang menentukan lokasi terjadinya data sensitif yang mencakup beberapa baris dalam file. TXT
"lineRanges": [
{
"end": 54,
"start": 51,
"startColumn": 1
}
]
Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi terjadinya data sensitif (alamat surat) yang mencakup baris 51 hingga 54 file. Karakter pertama dalam kejadian merupakan karakter pertama di baris 51 dari file.
Array halaman
Berlaku untuk: File Adobe Portable Document Format (PDF)
Dalam pages
array, Page
objek menentukan halaman yang Macie mendeteksi terjadinya data sensitif di. Objek berisi bidang pageNumber
. pageNumber
Bidang menyimpan bilangan bulat yang menentukan nomor halaman halaman yang berisi kejadian.
Contoh berikut menunjukkan struktur Page
objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam file. PDF
"pages": [
{
"pageNumber": 10
}
]
Dalam contoh sebelumnya, temuan menunjukkan bahwa halaman 10 file berisi kejadian.
Array catatan
Berlaku untuk: wadah objek Apache Avro, file Apache Parquet, file, dan file JSON Lines JSON
Untuk wadah objek Avro atau file Parket, Record
objek dalam records
array menentukan indeks rekaman dan jalur ke bidang dalam catatan yang Macie mendeteksi terjadinya data sensitif. Untuk file JSON dan JSON Lines, Record
objek menentukan jalur ke bidang atau larik tempat Macie mendeteksi terjadinya data sensitif. Untuk file JSON Lines, ini juga menentukan indeks baris yang berisi kejadian.
Tabel berikut menjelaskan tujuan masing-masing bidang dalam objek Record
.
Bidang | Tipe | Deskripsi |
---|---|---|
jsonPath |
String |
Jalan, sebagai JSONPath ekspresi, untuk kejadian. Untuk wadah objek Avro atau file Parket, ini adalah jalur ke bidang dalam record ( Jika Macie mendeteksi data sensitif pada nama elemen apa pun di jalur, Macie menghilangkan bidang |
recordIndex |
Bilangan Bulat | Untuk wadah objek Avro atau file Parket, indeks rekaman, mulai dari 0, untuk catatan yang berisi kejadian. Untuk file JSON Lines, indeks baris, mulai dari 0, untuk baris yang berisi kejadian. Nilai ini selalu 0 untuk JSON file. |
Contoh berikut menunjukkan struktur Record
objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam file Parket.
"records": [
{
"jsonPath": "$['abcdefghijklmnopqrstuvwxyz']",
"recordIndex": 7663
}
]
Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif dalam catatan indeks 7663 (nomor rekor 7664). Dalam catatan itu, Macie mendeteksi data sensitif di bidang bernamaabcdefghijklmnopqrstuvwxyz
. JSONJalur lengkap ke bidang dalam catatan adalah$.abcdefghijklmnopqrstuvwxyz
. Bidang adalah keturunan langsung dari objek root (tingkat luar).
Contoh berikut juga menunjukkan struktur Record
objek untuk terjadinya data sensitif yang Macie terdeteksi dalam file Parket. Namun, dalam contoh ini, Macie memotong nama bidang yang berisi kejadian karena nama melebihi batas karakter.
"records": [
{
"jsonPath": "$['...uvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz']",
"recordIndex": 7663
}
]
Dalam contoh sebelumnya, bidang adalah keturunan langsung dari objek root (tingkat luar).
Dalam contoh berikut, juga untuk terjadinya data sensitif yang terdeteksi Macie dalam file Parket, Macie memotong jalur lengkap ke bidang yang berisi kejadian tersebut. Jalur lengkap melebihi batas karakter.
"records": [
{
"jsonPath": "$..usssn2.usssn3.usssn4.usssn5.usssn6.usssn7.usssn8.usssn9.usssn10.usssn11.usssn12.usssn13.usssn14.usssn15.usssn16.usssn17.usssn18.usssn19.usssn20.usssn21.usssn22.usssn23.usssn24.usssn25.usssn26.usssn27.usssn28.usssn29['abcdefghijklmnopqrstuvwxyz']",
"recordIndex": 2335
}
]
Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif dalam catatan indeks 2335 (nomor rekor 2336). Dalam catatan itu, Macie mendeteksi data sensitif di bidang bernamaabcdefghijklmnopqrstuvwxyz
. JSONJalur lengkap ke bidang dalam catatan adalah:
$['1234567890']usssn1.usssn2.usssn3.usssn4.usssn5.usssn6.usssn7.usssn8.usssn9.usssn10.usssn11.usssn12.usssn13.usssn14.usssn15.usssn16.usssn17.usssn18.usssn19.usssn20.usssn21.usssn22.usssn23.usssn24.usssn25.usssn26.usssn27.usssn28.usssn29['abcdefghijklmnopqrstuvwxyz']
Contoh berikut menunjukkan struktur Record
objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam file. JSON Dalam contoh ini, kejadian adalah nilai tertentu dalam array.
"records": [
{
"jsonPath": "$.access.key[2]",
"recordIndex": 0
}
]
Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif dalam nilai kedua dari array bernama. key
Susunan adalah anak dari sebuah objek bernama access
.
Contoh berikut menunjukkan struktur Record
objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam file JSON Lines.
"records": [
{
"jsonPath": "$.access.key",
"recordIndex": 3
}
]
Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif dalam nilai ketiga (baris) dalam file. Pada baris itu, kejadiannya berada di bidang bernamakey
, yang merupakan anak dari objek bernamaaccess
.