Membuat pengidentifikasi data kustom - Amazon Macie

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Membuat pengidentifikasi data kustom

Pengenal data kustom adalah sekumpulan kriteria yang Anda tentukan untuk mendeteksi data sensitif di objek Amazon Simple Storage Service (Amazon S3). Saat membuat pengenal data kustom, Anda menentukan ekspresi reguler (regex) yang mendefinisikan pola teks agar sesuai dengan objek S3. Anda juga dapat menentukan urutan karakter dan aturan kedekatan yang menyempurnakan hasil. Urutan karakter dapat berupa: kata kunci, yang merupakan kata atau frasa yang harus berdekatan dengan teks yang cocok dengan regex, atau mengabaikan kata-kata, yang merupakan kata atau frasa untuk dikecualikan dari hasil. Dengan menggunakan pengenal data khusus, Anda dapat melengkapi pengidentifikasi data terkelola yang disediakan Amazon Macie, dan mendeteksi data sensitif yang mencerminkan skenario, kekayaan intelektual, atau data hak milik organisasi Anda.

Misalnya, banyak perusahaan memiliki sintaks khusus untuk karyawanIDs. Salah satu sintaks tersebut mungkin: huruf kapital yang menunjukkan apakah seorang karyawan adalah karyawan penuh waktu (F) atau paruh waktu (P), diikuti oleh tanda hubung (-), diikuti dengan urutan delapan digit yang mengidentifikasi karyawan. Contohnya adalah: F—12345678, untuk karyawan penuh waktu, dan P—87654321, untuk karyawan paruh waktu. Jika Anda membuat pengenal data kustom untuk mendeteksi karyawan IDs yang menggunakan sintaks ini, Anda dapat menggunakan regex berikut:. [A-Z]-\d{8} Untuk menyempurnakan analisis dan menghindari kesalahan positif, Anda juga dapat mengonfigurasi pengenal untuk menggunakan kata kunci (employeedanemployee ID) dan jarak pencocokan maksimum 20 karakter. Dengan kriteria ini, hasilnya mencakup teks yang cocok dengan regex hanya jika teks muncul setelah karyawan kata kunci atau ID karyawan dan semua teks terjadi dalam 20 karakter dari salah satu kata kunci tersebut.

Untuk demonstrasi bagaimana kata kunci dapat membantu Anda menemukan data sensitif dan menghindari positif palsu, tonton video berikut:

Selain kriteria deteksi, Anda dapat secara opsional menentukan pengaturan tingkat keparahan khusus untuk temuan yang dihasilkan oleh pengenal data kustom. Tingkat keparahan dapat didasarkan pada jumlah kemunculan teks yang cocok dengan kriteria deteksi pengenal. Jika Anda tidak menentukan pengaturan ini, Macie secara otomatis menetapkan tingkat keparahan Medium untuk semua temuan yang dihasilkan pengenal. Tingkat keparahan tidak berubah berdasarkan jumlah kemunculan teks yang cocok dengan kriteria deteksi pengenal.

Untuk informasi rinci tentang pengaturan ini dan lainnya, lihatOpsi konfigurasi untuk pengidentifikasi data kustom.

Untuk membuat pengenal data kustom

Ikuti langkah-langkah ini untuk membuat pengenal data kustom menggunakan konsol Amazon Macie. Untuk membuat pengidentifikasi data kustom secara terprogram, gunakan CreateCustomDataIdentifierpengoperasian Amazon Macie. API

  1. Buka konsol Amazon Macie di. https://console.aws.amazon.com/macie/

  2. Di panel navigasi, di bawah Pengaturan, pilih Pengidentifikasi data kustom.

  3. Pilih Buat.

  4. Untuk Nama, masukkan nama untuk pengidentifikasi data kustom. Nama dapat berisi sebanyak 128 karakter.

  5. Untuk Deskripsi, secara opsional masukkan deskripsi singkat tentang pengenal data kustom. Deskripsi dapat berisi sebanyak 512 karakter.

    catatan

    Hindari memasukkan data sensitif apa pun dalam nama atau deskripsi pengenal data kustom. Pengguna lain dari akun Anda mungkin dapat melihat nama atau deskripsi, tergantung pada tindakan yang diizinkan mereka lakukan di Macie.

  6. Untuk Regular expression, masukkan ekspresi reguler (regex) yang mendefinisikan pola teks agar sesuai. Regex dapat berisi sebanyak 512 karakter.

    Macie mendukung subset dari sintaks pola yang disediakan oleh perpustakaan Perl Compatible Regular Expressions (). PCRE Untuk detail dan tip tambahan, lihat Kriteria deteksi untuk pengidentifikasi data kustom.

  7. Untuk Kata Kunci, secara opsional masukkan sebanyak 50 urutan karakter (dipisahkan dengan koma) untuk menentukan teks tertentu yang harus berada di dekat teks yang cocok dengan pola regex.

    Macie menyertakan kejadian dalam hasil hanya jika teks cocok dengan pola regex dan teks berada dalam jarak kecocokan maksimum dari salah satu kata kunci ini. Setiap kata kunci dapat berisi 3-90 UTF -8 karakter. Kata kunci tidak peka huruf besar atau kecil.

  8. Untuk kata Abaikan, secara opsional masukkan sebanyak 10 urutan karakter (dipisahkan dengan koma) yang menentukan teks tertentu untuk dikecualikan dari hasil.

    Macie mengecualikan kejadian dari hasil jika teks cocok dengan pola regex tetapi berisi salah satu dari kata-kata abaikan ini. Setiap kata abaikan dapat berisi 4-90 UTF -8 karakter. Abaikan kata peka akan huruf besar kecil.

  9. Untuk jarak pencocokan maksimum, secara opsional masukkan jumlah maksimum karakter yang dapat ada antara akhir kata kunci dan akhir teks yang cocok dengan pola regex.

    Macie menyertakan kejadian dalam hasil hanya jika teks cocok dengan pola regex dan teks berada dalam jarak ini dari kata kunci lengkap. Jaraknya bisa 1-300 karakter. Jarak default adalah 50 karakter.

  10. Untuk Keparahan, pilih cara menentukan tingkat keparahan temuan data sensitif yang dihasilkan oleh pengidentifikasi data kustom:

    • Untuk secara otomatis menetapkan tingkat keparahan Sedang ke semua temuan, pilih Gunakan tingkat keparahan Sedang untuk sejumlah kecocokan (default). Dengan opsi ini, Macie secara otomatis menetapkan tingkat keparahan Medium ke temuan jika objek S3 yang terpengaruh berisi satu atau lebih kemunculan teks yang cocok dengan kriteria deteksi.

    • Untuk menetapkan tingkat keparahan berdasarkan ambang kemunculan yang Anda tentukan, pilih Gunakan setelan khusus untuk menentukan tingkat keparahan. Kemudian gunakan opsi ambang Kemunculan dan tingkat keparahan untuk menentukan jumlah minimum kecocokan yang harus ada di objek S3 untuk menghasilkan temuan dengan tingkat keparahan yang dipilih.

      Anda dapat menentukan sebanyak tiga ambang kemunculan, satu untuk setiap tingkat keparahan yang didukung Macie: Rendah (paling parah), Sedang, atau Tinggi (paling parah). Jika Anda menentukan lebih dari satu, ambang batas harus dalam urutan menaik berdasarkan tingkat keparahan, bergerak dari Rendah ke Tinggi. Jika objek S3 berisi lebih sedikit kemunculan daripada ambang batas terendah yang ditentukan, Macie tidak membuat temuan.

  11. (Opsional) Untuk Tag, pilih Tambahkan tag, lalu masukkan sebanyak 50 tag untuk ditetapkan ke pengenal data khusus.

    Tag adalah label yang Anda tentukan dan tetapkan ke jenis AWS sumber daya tertentu. Setiap tanda terdiri dari kunci tanda yang diperlukan dan nilai tanda opsional. Tag dapat membantu Anda mengidentifikasi, mengkategorikan, dan mengelola sumber daya dengan cara yang berbeda, seperti berdasarkan tujuan, pemilik, lingkungan, atau kriteria lainnya. Untuk mempelajari selengkapnya, lihat Menandai sumber daya Macie.

  12. (Opsional) Untuk Mengevaluasi, masukkan hingga 1.000 karakter di kotak Data sampel, lalu pilih Uji untuk menguji kriteria deteksi. Macie mengevaluasi data sampel dan melaporkan jumlah kemunculan teks yang sesuai dengan kriteria. Anda dapat mengulangi langkah ini sebanyak yang Anda suka untuk menyempurnakan dan mengoptimalkan kriteria.

    catatan

    Kami sangat menyarankan Anda menguji dan menyempurnakan kriteria deteksi sebelum Anda menyimpan pengenal data kustom. Karena pengidentifikasi data kustom digunakan oleh tugas penemuan data sensitif, Anda tidak dapat mengedit pengidentifikasi data kustom setelah menyimpannya. Hal ini membantu untuk memastikan bahwa Anda memiliki riwayat tetap temuan dan hasil penemuan data sensitif untuk audit privasi dan perlindungan data atau investigasi yang Anda lakukan.

  13. Setelah selesai, spilih Kirim.

Macie menguji pengaturan dan memverifikasi bahwa ia dapat mengkompilasi regex. Jika ada masalah dengan pengaturan atau regex, Macie menampilkan kesalahan yang menjelaskan masalah tersebut. Setelah mengatasi masalah apa pun, Anda dapat menyimpan pengenal data khusus. Anda kemudian dapat membuat dan mengonfigurasi pekerjaan penemuan data sensitif untuk menggunakan pengenal, atau menambahkan pengenal ke pengaturan Anda untuk penemuan data sensitif otomatis.