Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Mengakses data tabel
Ada beberapa cara untuk mengakses tabel di bucket tabel Amazon S3. Anda dapat mengintegrasikan tabel dengan layanan AWS analitik menggunakan AWS Glue Data Catalog, atau mengakses tabel secara langsung menggunakan Iceberg REST titik akhir Tabel Amazon S3 atau Katalog Tabel Amazon S3 untuk. Apache Iceberg Metode akses yang Anda gunakan akan bergantung pada pengaturan katalog, model tata kelola, dan kebutuhan kontrol akses Anda. Berikut ini adalah ikhtisar metode akses ini.
- AWS Glue Data Catalog integrasi
Ini adalah metode akses yang disarankan untuk bekerja dengan tabel di ember tabel S3. Integrasi ini memberi Anda tampilan terpadu dari data estate Anda di berbagai layanan AWS analitik melalui. AWS Glue Data Catalog Setelah integrasi, Anda dapat menanyakan tabel menggunakan layanan seperti Athena dan Amazon Redshift. Akses ke tabel dikelola menggunakan izin IAM. Untuk mengakses tabel menggunakan integrasi ini, identitas IAM yang Anda gunakan memerlukan akses ke sumber daya dan tindakan Tabel S3, AWS Glue Data Catalog objek, dan mesin kueri yang Anda gunakan. Untuk informasi selengkapnya, lihat Manajemen akses untuk Tabel S3.
- Akses langsung
Gunakan metode ini jika Anda perlu bekerja dengan implementasi katalog AWS Partner Network (APN), implementasi katalog kustom, atau jika Anda hanya perlu melakukan read/write operasi dasar pada tabel dalam satu keranjang tabel. Akses ke tabel dikelola menggunakan izin IAM. Untuk mengakses tabel, identitas IAM yang Anda gunakan memerlukan akses ke sumber daya tabel dan tindakan Tabel S3. Untuk informasi selengkapnya, lihat Manajemen akses untuk Tabel S3.
Mengakses tabel melalui integrasi AWS Glue Data Catalog
Anda dapat mengintegrasikan bucket tabel S3 AWS Glue Data Catalog untuk mengakses tabel dari layanan AWS analitik, seperti Amazon Athena, Amazon Redshift, dan Quick. Integrasi mengisi AWS Glue Data Catalog dengan sumber daya tabel Anda, dan menggabungkan akses ke sumber daya tersebut. Untuk informasi lebih lanjut tentang integrasi, lihatMengintegrasikan Tabel AWS Amazon S3 dengan layanan analitik.
Layanan AWS analitik berikut dapat mengakses tabel melalui integrasi ini:
Mengakses tabel menggunakan titik akhir AWS GlueIceberg REST
Setelah bucket tabel S3 terintegrasi AWS Glue Data Catalog, Anda juga dapat menggunakan AWS GlueIceberg REST titik akhir untuk terhubung ke tabel S3 dari mesin kueri pihak ketiga yang mendukung. Iceberg Untuk informasi selengkapnya, lihat Mengakses tabel Amazon S3 menggunakan titik akhir AWS GlueIceberg REST.
Sebaiknya gunakan AWS GlueIceberg REST titik akhir saat Anda ingin mengakses tabel dariSpark,PyIceberg, atau klien lain Iceberg yang kompatibel.
Klien berikut dapat mengakses tabel secara langsung melalui AWS GlueIceberg REST titik akhir:
Setiap Iceberg klien, termasukSpark,PyIceberg, dan banyak lagi.
Mengakses tabel secara langsung
Anda dapat mengakses tabel langsung dari mesin kueri sumber terbuka melalui metode yang menjembatani operasi manajemen Tabel S3 ke aplikasi Apache Iceberg analitik Anda. Ada dua metode akses langsung: Iceberg REST titik akhir Tabel Amazon S3 atau Katalog Tabel Amazon S3 untuk. Apache Iceberg RESTTitik akhir direkomendasikan.
Kami merekomendasikan akses langsung jika Anda mengakses tabel dalam implementasi katalog yang dikelola sendiri, atau hanya perlu melakukan read/write operasi dasar pada tabel dalam satu keranjang tabel. Untuk skenario akses lainnya, kami merekomendasikan AWS Glue Data Catalog integrasi.
Akses langsung ke tabel dikelola melalui kebijakan berbasis identitas IAM atau kebijakan berbasis sumber daya yang dilampirkan pada tabel dan bucket tabel.
Mengakses tabel melalui titik akhir Tabel Amazon S3 Iceberg REST
Anda dapat menggunakan Iceberg REST endpoint Amazon S3 Tables untuk mengakses tabel Anda langsung dari klien yang Iceberg REST kompatibel melalui HTTP titik akhir, untuk informasi selengkapnya, lihat. Mengakses tabel menggunakan endpoint Amazon S3 Iceberg REST Tables
Layanan AWS analitik dan mesin kueri berikut dapat mengakses tabel secara langsung menggunakan titik akhir Tabel Iceberg REST Amazon S3:
Mesin kueri yang didukung
Setiap Iceberg klien, termasukSpark,PyIceberg, dan banyak lagi.
Mengakses tabel langsung melalui Katalog Tabel Amazon S3 untuk Apache Iceberg
Anda juga dapat mengakses tabel langsung dari mesin kueri seperti Apache Spark dengan menggunakan katalog klien Tabel S3, untuk informasi selengkapnya, lihatMengakses tabel Amazon S3 dengan Katalog Tabel Amazon S3 untuk Apache Iceberg. Namun, S3 merekomendasikan penggunaan endpoint Amazon S3 Iceberg REST Tables untuk akses langsung karena mendukung lebih banyak aplikasi, tanpa memerlukan bahasa atau kode khusus mesin.
Mesin query berikut dapat mengakses tabel secara langsung menggunakan katalog klien: