Sinkronkan metadata Delta Lake - Amazon Athena

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Sinkronkan metadata Delta Lake

Athena menyinkronkan metadata tabel, termasuk skema, kolom partisi, dan properti tabel, jika AWS Glue Anda menggunakan Athena untuk membuat tabel Delta Lake Anda. Seiring berjalannya waktu, metadata ini dapat kehilangan sinkronisasi dengan metadata tabel yang mendasarinya di log transaksi. Untuk memperbarui tabel Anda, Anda dapat memilih salah satu opsi berikut:

Perhatikan bahwa fitur-fitur berikut mengharuskan AWS Glue skema Anda untuk selalu memiliki skema yang sama dengan log transaksi:

  • Lake Formation

  • Tampilan

  • Filter baris dan kolom

Jika alur kerja Anda tidak memerlukan fungsionalitas ini, dan Anda memilih untuk tidak mempertahankan kompatibilitas ini, Anda dapat menggunakan CREATE TABLE DDL di Athena dan kemudian menambahkan jalur Amazon S3 sebagai parameter di. SerDe AWS Glue

Untuk membuat tabel Danau Delta menggunakan AWS Glue Athena dan konsol
  1. Buka konsol Athena di https://console.aws.amazon.com/athena/.

  2. Di editor kueri Athena, gunakan yang berikut ini DDL untuk membuat tabel Delta Lake Anda. Perhatikan bahwa saat menggunakan metode ini, nilai untuk TBLPROPERTIES harus 'spark.sql.sources.provider' = 'delta' dan tidak'table_type' = 'delta'.

    Perhatikan bahwa skema yang sama ini (dengan satu kolom bernama col tipearray<string>) dimasukkan saat Anda menggunakan Apache Spark (Athena untuk Apache Spark) atau sebagian besar mesin lain untuk membuat tabel Anda.

    CREATE EXTERNAL TABLE [db_name.]table_name(col array<string>) LOCATION 's3://amzn-s3-demo-bucket/your-folder/' TBLPROPERTIES ('spark.sql.sources.provider' = 'delta')
  3. Buka AWS Glue konsol di https://console.aws.amazon.com/glue/.

  4. Di panel navigasi, pilih Katalog Data, Tabel.

  5. Dalam daftar tabel, pilih tautan untuk tabel Anda.

  6. Pada halaman untuk tabel, pilih Tindakan, Edit tabel.

  7. Di bagian parameter Serde, tambahkan kunci path dengan nilais3://amzn-s3-demo-bucket/your-folder/.

  8. Pilih Simpan.