Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
AWS Lake Formation adalah layanan terkelola yang membantu Anda menemukan, membuat katalog, membersihkan, dan mengamankan data di danau data Amazon Simple Storage Service (S3) Amazon Simple Storage Service (S3). Lake Formation menyediakan akses tingkat kolom berbutir halus ke database dan tabel di Katalog Data Glue. AWS Untuk informasi selengkapnya, lihat Apa itu AWS Lake Formation?
Dengan Amazon EMR rilis 6.7.0 dan yang lebih baru, Anda dapat menerapkan kontrol akses berbasis Lake Formation ke pekerjaan Spark, Hive, dan Presto yang Anda kirimkan ke kluster Amazon EMR. Untuk berintegrasi dengan Lake Formation, Anda harus membuat cluster EMR dengan peran runtime. Peran runtime adalah peran AWS Identity and Access Management (IAM) yang Anda kaitkan dengan pekerjaan atau kueri EMR Amazon. Amazon EMR kemudian menggunakan peran ini untuk mengakses AWS sumber daya. Untuk informasi selengkapnya, lihat Peran runtime untuk langkah-langkah EMR Amazon.
Bagaimana Amazon EMR bekerja dengan Lake Formation
Setelah mengintegrasikan Amazon EMR dengan Lake Formation, Anda dapat menjalankan kueri ke klaster EMR Amazon dengan API atau dengan AI Studio. Step
SageMaker Kemudian, Lake Formation menyediakan akses ke data melalui kredensyal sementara untuk Amazon EMR. Proses ini disebut credential vending. Untuk informasi selengkapnya, lihat Apa itu AWS Lake Formation?
Berikut ini adalah ikhtisar tingkat tinggi tentang bagaimana Amazon EMR mendapatkan akses ke data yang dilindungi oleh kebijakan keamanan Lake Formation.

-
Seorang pengguna mengirimkan kueri EMR Amazon untuk data di Lake Formation.
-
Amazon EMR meminta kredensyal sementara dari Lake Formation untuk memberikan akses data pengguna.
-
Lake Formation mengembalikan kredensyal sementara.
-
Amazon EMR mengirimkan permintaan kueri untuk mengambil data dari Amazon S3.
-
Amazon EMR menerima data dari Amazon S3, memfilternya, dan mengembalikan hasil berdasarkan izin pengguna yang ditentukan pengguna di Lake Formation.
Untuk informasi selengkapnya tentang penambahan pengguna dan grup ke kebijakan Lake Formation, lihat Memberikan izin Katalog Data.
Prasyarat
Anda harus memenuhi persyaratan berikut sebelum mengintegrasikan Amazon EMR dan Lake Formation:
-
Aktifkan otorisasi peran runtime di klaster EMR Amazon Anda.
-
Gunakan AWS Glue Data Catalog sebagai toko metadata Anda.
-
Tentukan dan kelola izin di Lake Formation untuk mengakses database, tabel, dan kolom di AWS Glue Data Catalog. Untuk informasi selengkapnya, lihat Apa itu AWS Lake Formation?