Skema untuk melaporkan lokasi data sensitif - Amazon Macie

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Skema untuk melaporkan lokasi data sensitif

Amazon Macie menggunakan JSON struktur standar untuk menyimpan informasi tentang di mana ia menemukan data sensitif di objek Amazon Simple Storage Service (Amazon S3). Struktur digunakan oleh temuan data sensitif dan hasil penemuan data sensitif. Untuk temuan data sensitif, struktur adalah bagian dari JSON skema temuan. Untuk meninjau JSON skema lengkap untuk temuan, lihat Temuan di Referensi Amazon API Macie. Untuk mempelajari selengkapnya tentang hasil penemuan data sensitif, lihat Menyimpan dan mempertahankan hasil penemuan data sensitif.

Ikhtisar skema

Untuk melaporkan lokasi data sensitif yang ditemukan Amazon Macie di objek S3 yang terpengaruh, JSON skema untuk temuan data sensitif dan hasil penemuan data sensitif mencakup satu customDataIdentifiers objek dan satu objek. sensitiveData customDataIdentifiersObjek memberikan detail tentang data yang dideteksi Macie menggunakan pengidentifikasi data khusus. sensitiveDataObjek memberikan rincian tentang data yang dideteksi Macie menggunakan pengidentifikasi data terkelola.

Setiap objek customDataIdentifiers dan sensitiveData berisi satu arraydetections atau lebih:

  • Dalam sebuah customDataIdentifiers objek, detections array menunjukkan pengidentifikasi data kustom mana yang mendeteksi data dan menghasilkan temuan. Untuk setiap pengidentifikasi data kustom, array juga menunjukkan jumlah kejadian data yang dideteksi pengidentifikasi. Array tersebut juga dapat menunjukkan lokasi data yang terdeteksi oleh pengenal.

  • Pada objek sensitiveData, array detections yang menunjukkan tipe data sensitif yang Macie deteksi menggunakan pengidentifikasi data terkelola. Untuk setiap tipe data sensitif, array juga menunjukkan jumlah kejadian dari data, dan dapat menunjukkan lokasi data.

Untuk temuan data sensitif, array detections dapat mencakup 1-15 objek occurrences. Setiap occurrences objek menentukan di mana Macie mendeteksi kejadian individu dari jenis data sensitif tertentu.

Misalnya, detections larik berikut menunjukkan lokasi tiga kejadian data sensitif (nomor Jaminan Sosial AS) yang ditemukan Macie dalam file. CSV

"sensitiveData": [ { "category": "PERSONAL_INFORMATION", "detections": [ { "count": 30, "occurrences": { "cells": [ { "cellReference": null, "column": 1, "columnName": "SSN", "row": 2 }, { "cellReference": null, "column": 1, "columnName": "SSN", "row": 3 }, { "cellReference": null, "column": 1, "columnName": "SSN", "row": 4 } ] }, "type": "USA_SOCIAL_SECURITY_NUMBER" }

Lokasi dan jumlah occurrences objek dalam detections array bervariasi berdasarkan kategori, jenis, dan jumlah kejadian data sensitif yang dideteksi Macie selama siklus analisis penemuan data sensitif otomatis atau menjalankan pekerjaan penemuan data sensitif. Untuk setiap siklus analisis atau menjalankan pekerjaan, Macie menggunakan algoritme pencarian kedalaman pertama untuk mengisi temuan yang dihasilkan dengan data lokasi untuk 1-15 kemunculan data sensitif yang dideteksi Macie di objek S3. Kejadian ini menunjukkan kategori dan jenis data sensitif yang mungkin berisi bucket dan objek S3 yang terpengaruh.

occurrencesObjek dapat berisi struktur berikut, tergantung pada jenis file atau format penyimpanan objek S3 yang terpengaruh:

  • cellsarray - Array ini berlaku untuk buku kerja, CSV file, dan TSV file Microsoft Excel. Objek dalam array ini menentukan sel atau bidang yang Macie mendeteksi terjadinya data sensitif.

  • lineRangesarray — Array ini berlaku untuk file pesan email (EML), dan file teks non-biner selainCSV,, JSON GarisJSON, dan TSV file — misalnya,,HTML, TXT dan file. XML Objek dalam larik ini menentukan garis atau rentang garis inklusif tempat Macie mendeteksi terjadinya data sensitif, dan posisi data pada garis atau garis yang ditentukan.

    Dalam kasus tertentu, objek dalam lineRanges array menentukan lokasi deteksi data sensitif dalam jenis file atau format penyimpanan yang didukung oleh jenis array lain. Kasus-kasus tersebut adalah: deteksi di bagian tidak terstruktur dari file yang terstruktur, seperti komentar dalam file; deteksi dalam file cacat yang dianalisis Macie sebagai plaintext; dan, TSV file CSV atau yang memiliki satu atau lebih nama kolom tempat Macie mendeteksi data sensitif.

  • Array offsetRanges - Array ini dicadangkan untuk penggunaan di waktu yang akan datang. Jika array ini hadir, nilai untuk itu adalah null.

  • pagesarray - Array ini berlaku untuk file Adobe Portable Document Format (PDF). Sebuah objek dalam array ini menentukan halaman yang Macie mendeteksi terjadinya data sensitif di.

  • recordsarray - Array ini berlaku untuk wadah objek Apache Avro, file Apache Parquet, file, dan file JSON Lines. JSON Untuk wadah objek Avro dan file Parket, objek dalam array ini menentukan indeks rekaman dan jalur ke bidang dalam catatan yang Macie mendeteksi terjadinya data sensitif. Untuk JSON dan JSON Lines file, objek dalam array ini menentukan jalur ke bidang atau array yang Macie mendeteksi terjadinya data sensitif di. Untuk file JSON Lines, ini juga menentukan indeks baris yang berisi data.

Isi dari susunan ini bervariasi berdasarkan tipe file atau format penyimpanan objek S3 terpengaruh dan isinya.

Detail skema dan contoh

Amazon Macie menyesuaikan konten JSON struktur yang digunakannya untuk menunjukkan di mana ia mendeteksi data sensitif dalam jenis file dan konten tertentu. Topik berikut menjelaskan dan memberikan contoh struktur ini.

Untuk daftar lengkap JSON struktur yang dapat disertakan dalam temuan data sensitif, lihat Temuan di Referensi Amazon Macie API.

Cell array

Berlaku untuk: Buku kerja, CSV file, dan TSV file Microsoft Excel

Dalam cells array, Cell objek menentukan sel atau bidang yang Macie mendeteksi terjadinya data sensitif di. Tabel berikut menjelaskan tujuan masing-masing bidang dalam objek Cell.

Bidang Tipe Deskripsi
cellReference String Lokasi sel, sebagai referensi sel absolut, yang berisi kejadian. Bidang ini hanya berlaku untuk buku kerja Excel. Nilai ini adalah null for CSV dan TSV file.
column Bilangan Bulat Nomor kolom kolom yang berisi kejadian. Untuk buku kerja Excel, nilai ini berkorelasi dengan karakter abjad (-abjad) untuk pengidentifikasi kolom — misalnya, 1 untuk kolom A, 2untuk kolom B, dan seterusnya.
columnName String Nama kolom yang berisi kejadian, jika tersedia.
row Bilangan Bulat Nomor baris baris yang berisi kejadian.

Contoh berikut menunjukkan struktur Cell objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam file. CSV

"cells": [ { "cellReference": null, "column": 3, "columnName": "SSN", "row": 5 } ]

Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif di bidang di baris kelima dari kolom ketiga (bernama SSN) file.

Contoh berikut menunjukkan struktur Cell objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam buku kerja Excel.

"cells": [ { "cellReference": "Sheet2!C5", "column": 3, "columnName": "SSN", "row": 5 } ]

Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif di lembar kerja bernama Sheet2 di buku kerja. Di lembar kerja itu, Macie mendeteksi data sensitif di sel di baris kelima kolom ketiga (kolom C, bernama SSN).

LineRangesarray

Berlaku untuk: File pesan email (EML), dan file teks non-biner selainCSV,, JSON BarisJSON, dan TSV file — misalnya,,, HTML dan file TXT XML

Dalam lineRanges array, Range objek menentukan garis atau rentang garis inklusif tempat Macie mendeteksi terjadinya data sensitif, dan posisi data pada garis atau garis yang ditentukan.

Objek ini sering kosong demi tipe file yang didukung oleh tipe lain dari susunan di objek occurrences. Pengecualian nya adalah:

  • Data di bagian yang tidak terstruktur dari file lain yang terstruktur, seperti komentar dalam file.

  • Data dalam file cacat ketika Macie menganalisisnya sebagai plaintext.

  • Sebuah CSV atau TSV file yang memiliki satu atau beberapa nama kolom tempat Macie mendeteksi data sensitif.

Tabel berikut menjelaskan tujuan masing-masing bidang dalam Objek Range dari objek susunan lineRanges.

Bidang Tipe Deskripsi
end Bilangan Bulat Jumlah baris dari awal file hingga akhir kejadian.
start Bilangan Bulat Jumlah baris dari awal file hingga awal kejadian.
startColumn Bilangan Bulat Jumlah karakter, dengan spasi dan mulai dari 1, dari awal baris pertama yang berisi kejadian (start) hingga awal terjadinya.

Contoh berikut menunjukkan struktur Range objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi pada satu baris dalam file. TXT

"lineRanges": [ { "end": 1, "start": 1, "startColumn": 119 } ]

Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi kejadian lengkap data sensitif (alamat surat) di baris pertama file. Karakter pertama dalam kejadian adalah 119 karakter (dengan spasi) dimulai dari awal baris itu.

Contoh berikut menunjukkan struktur Range objek yang menentukan lokasi terjadinya data sensitif yang mencakup beberapa baris dalam file. TXT

"lineRanges": [ { "end": 54, "start": 51, "startColumn": 1 } ]

Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi terjadinya data sensitif (alamat surat) yang mencakup baris 51 hingga 54 file. Karakter pertama dalam kejadian merupakan karakter pertama di baris 51 dari file.

Array halaman

Berlaku untuk: File Adobe Portable Document Format (PDF)

Dalam pages array, Page objek menentukan halaman yang Macie mendeteksi terjadinya data sensitif di. Objek berisi bidang pageNumber. pageNumberBidang menyimpan bilangan bulat yang menentukan nomor halaman halaman yang berisi kejadian.

Contoh berikut menunjukkan struktur Page objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam file. PDF

"pages": [ { "pageNumber": 10 } ]

Dalam contoh sebelumnya, temuan menunjukkan bahwa halaman 10 file berisi kejadian.

Array catatan

Berlaku untuk: wadah objek Apache Avro, file Apache Parquet, file, dan file JSON Lines JSON

Untuk wadah objek Avro atau file Parket, Record objek dalam records array menentukan indeks rekaman dan jalur ke bidang dalam catatan yang Macie mendeteksi terjadinya data sensitif. Untuk file JSON dan JSON Lines, Record objek menentukan jalur ke bidang atau larik tempat Macie mendeteksi terjadinya data sensitif. Untuk file JSON Lines, ini juga menentukan indeks baris yang berisi kejadian.

Tabel berikut menjelaskan tujuan masing-masing bidang dalam objek Record.

Bidang Tipe Deskripsi
jsonPath String

Jalan, sebagai JSONPath ekspresi, untuk kejadian.

Untuk wadah objek Avro atau file Parket, ini adalah jalur ke bidang dalam record (recordIndex) yang berisi kejadian. Untuk file JSON atau JSON Garis, ini adalah jalur ke bidang atau array yang berisi kejadian. Jika data adalah nilai dalam array, jalur juga menunjukkan nilai mana yang berisi kejadian.

Jika Macie mendeteksi data sensitif pada nama elemen apa pun di jalur, Macie menghilangkan bidang jsonPath dari objek Record. Jika nama elemen jalur melebihi 240 karakter, Macie memotong nama dengan menghapus karakter dari awal nama. Jika jalur penuh yang dihasilkan melebihi 250 karakter, Macie juga akan memotong jalan, dimulai dengan elemen pertama yang ada di jalur, hingga jalan berisi 250 karakter atau lebih sedikit.

recordIndex Bilangan Bulat Untuk wadah objek Avro atau file Parket, indeks rekaman, mulai dari 0, untuk catatan yang berisi kejadian. Untuk file JSON Lines, indeks baris, mulai dari 0, untuk baris yang berisi kejadian. Nilai ini selalu 0 untuk JSON file.

Contoh berikut menunjukkan struktur Record objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam file Parket.

"records": [ { "jsonPath": "$['abcdefghijklmnopqrstuvwxyz']", "recordIndex": 7663 } ]

Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif dalam catatan indeks 7663 (nomor rekor 7664). Dalam catatan itu, Macie mendeteksi data sensitif di bidang bernamaabcdefghijklmnopqrstuvwxyz. JSONJalur lengkap ke bidang dalam catatan adalah$.abcdefghijklmnopqrstuvwxyz. Bidang adalah keturunan langsung dari objek root (tingkat luar).

Contoh berikut juga menunjukkan struktur Record objek untuk terjadinya data sensitif yang Macie terdeteksi dalam file Parket. Namun, dalam contoh ini, Macie memotong nama bidang yang berisi kejadian karena nama melebihi batas karakter.

"records": [ { "jsonPath": "$['...uvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz']", "recordIndex": 7663 } ]

Dalam contoh sebelumnya, bidang adalah keturunan langsung dari objek root (tingkat luar).

Dalam contoh berikut, juga untuk terjadinya data sensitif yang terdeteksi Macie dalam file Parket, Macie memotong jalur lengkap ke bidang yang berisi kejadian tersebut. Jalur lengkap melebihi batas karakter.

"records": [ { "jsonPath": "$..usssn2.usssn3.usssn4.usssn5.usssn6.usssn7.usssn8.usssn9.usssn10.usssn11.usssn12.usssn13.usssn14.usssn15.usssn16.usssn17.usssn18.usssn19.usssn20.usssn21.usssn22.usssn23.usssn24.usssn25.usssn26.usssn27.usssn28.usssn29['abcdefghijklmnopqrstuvwxyz']", "recordIndex": 2335 } ]

Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif dalam catatan indeks 2335 (nomor rekor 2336). Dalam catatan itu, Macie mendeteksi data sensitif di bidang bernamaabcdefghijklmnopqrstuvwxyz. JSONJalur lengkap ke bidang dalam catatan adalah:

$['1234567890']usssn1.usssn2.usssn3.usssn4.usssn5.usssn6.usssn7.usssn8.usssn9.usssn10.usssn11.usssn12.usssn13.usssn14.usssn15.usssn16.usssn17.usssn18.usssn19.usssn20.usssn21.usssn22.usssn23.usssn24.usssn25.usssn26.usssn27.usssn28.usssn29['abcdefghijklmnopqrstuvwxyz']

Contoh berikut menunjukkan struktur Record objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam file. JSON Dalam contoh ini, kejadian adalah nilai tertentu dalam array.

"records": [ { "jsonPath": "$.access.key[2]", "recordIndex": 0 } ]

Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif dalam nilai kedua dari array bernama. key Susunan adalah anak dari sebuah objek bernama access.

Contoh berikut menunjukkan struktur Record objek yang menentukan lokasi terjadinya data sensitif yang Macie terdeteksi dalam file JSON Lines.

"records": [ { "jsonPath": "$.access.key", "recordIndex": 3 } ]

Dalam contoh sebelumnya, temuan menunjukkan bahwa Macie mendeteksi data sensitif dalam nilai ketiga (baris) dalam file. Pada baris itu, kejadiannya berada di bidang bernamakey, yang merupakan anak dari objek bernamaaccess.