Konektor Amazon Athena Postgre SQL - Amazon Athena

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Konektor Amazon Athena Postgre SQL

Konektor Amazon Athena Postgre SQL memungkinkan Athena mengakses database Postgre Anda. SQL

Prasyarat

Batasan

  • DDLOperasi tulis tidak didukung.

  • Dalam pengaturan multiplexer, bucket tumpahan dan awalan dibagikan di semua instance database.

  • Batas Lambda yang relevan. Untuk informasi selengkapnya, lihat Kuota Lambda dalam Panduan Pengembang AWS Lambda .

  • Seperti Postgre, SQL Athena memperlakukan ruang belakang dalam SQL CHAR tipe Postgre secara semantik tidak signifikan untuk tujuan panjang dan perbandingan. Perhatikan bahwa ini hanya berlaku untuk CHAR tetapi tidak untuk VARCHAR tipe. Athena mengabaikan spasi tambahan untuk CHAR tipe tersebut, tetapi memperlakukannya sebagai hal yang signifikan untuk jenisnya. VARCHAR

  • Bila Anda menggunakan tipe data string karakter case-insensitive citext, Postgre SQL menggunakan perbandingan data case insensitive yang berbeda dari Athena. Perbedaan ini menciptakan perbedaan data selama SQL JOIN operasi. Untuk mengatasi masalah ini, gunakan fitur kueri passthrough konektor PostgreSQL. Untuk informasi selengkapnya, lihat bagian kueri passthrough nanti di dokumen ini.

Ketentuan

Istilah-istilah berikut berhubungan dengan konektor PostgreSQL.

  • Instans database — Instance apa pun dari database yang digunakan di tempat, di AmazonEC2, atau di AmazonRDS.

  • Handler - Handler Lambda yang mengakses instance database Anda. Handler bisa untuk metadata atau untuk catatan data.

  • Metadata handler — Penangan Lambda yang mengambil metadata dari instance database Anda.

  • Record handler - Handler Lambda yang mengambil catatan data dari instance database Anda.

  • Composite handler — Handler Lambda yang mengambil data metadata dan data dari instance database Anda.

  • Properti atau parameter - Properti database yang digunakan oleh penangan untuk mengekstrak informasi database. Anda mengonfigurasi properti ini sebagai variabel lingkungan Lambda.

  • Connection String — Sebuah string teks yang digunakan untuk membuat koneksi ke instance database.

  • Katalog —AWS Glue Non-katalog yang terdaftar di Athena yang merupakan awalan yang diperlukan untuk properti. connection_string

  • Multiplexing handler - Handler Lambda yang dapat menerima dan menggunakan beberapa koneksi database.

Parameter

Gunakan variabel lingkungan Lambda di bagian ini untuk mengkonfigurasi konektor SQL Postgre.

String koneksi

Gunakan string JDBC koneksi dalam format berikut untuk terhubung ke instance database.

postgres://${jdbc_connection_string}

Menggunakan handler multiplexing

Anda dapat menggunakan multiplexer untuk terhubung ke beberapa instance database dengan satu fungsi Lambda. Permintaan dirutekan dengan nama katalog. Gunakan kelas-kelas berikut di Lambda.

Handler Kelas
Handler komposit PostGreSqlMuxCompositeHandler
Penangan metadata PostGreSqlMuxMetadataHandler
Rekam handler PostGreSqlMuxRecordHandler

Parameter handler multiplexing

Parameter Deskripsi
$catalog_connection_string Wajib. Sebuah string koneksi instance database. Awalan variabel lingkungan dengan nama katalog yang digunakan di Athena. Misalnya, jika katalog terdaftar di Athena adalahmypostgrescatalog, maka nama variabel lingkungan adalah. mypostgrescatalog_connection_string
default Wajib. String koneksi default. String ini digunakan saat katalog lambda:${AWS_LAMBDA_FUNCTION_NAME}.

Contoh properti berikut adalah untuk fungsi PostGreSql MUX Lambda yang mendukung dua instance database: postgres1 (default), dan. postgres2

Properti Nilai
default postgres://jdbc:postgresql://postgres1.host:5432/default?${Test/RDS/PostGres1}
postgres_catalog1_connection_string postgres://jdbc:postgresql://postgres1.host:5432/default?${Test/RDS/PostGres1}
postgres_catalog2_connection_string postgres://jdbc:postgresql://postgres2.host:5432/default?user=sample&password=sample

Memberikan kredensi

Untuk memberikan nama pengguna dan kata sandi untuk database Anda dalam string JDBC koneksi Anda, Anda dapat menggunakan properti string koneksi atau AWS Secrets Manager.

  • Connection String - Nama pengguna dan kata sandi dapat ditentukan sebagai properti dalam string JDBC koneksi.

    penting

    Sebagai praktik keamanan terbaik, jangan gunakan kredensi hardcode dalam variabel lingkungan atau string koneksi Anda. Untuk informasi tentang memindahkan rahasia hardcode Anda AWS Secrets Manager, lihat Memindahkan rahasia hardcode ke AWS Secrets Manager dalam Panduan Pengguna.AWS Secrets Manager

  • AWS Secrets Manager— Untuk menggunakan fitur Kueri Federasi Athena dengan AWS Secrets Manager, fungsi yang VPC terhubung ke Lambda Anda harus memiliki akses internet atau titik VPCakhir untuk terhubung ke Secrets Manager.

    Anda dapat memasukkan nama rahasia ke AWS Secrets Manager dalam string JDBC koneksi Anda. Konektor menggantikan nama rahasia dengan password nilai username dan dari Secrets Manager.

    Untuk instans RDS database Amazon, dukungan ini terintegrasi erat. Jika Anda menggunakan AmazonRDS, kami sangat menyarankan penggunaan AWS Secrets Manager dan rotasi kredenal. Jika database Anda tidak menggunakan AmazonRDS, simpan kredensialnya seperti JSON dalam format berikut:

    {"username": "${username}", "password": "${password}"}
Contoh string koneksi dengan nama rahasia

String berikut memiliki nama rahasia${Test/RDS/PostGres1}.

postgres://jdbc:postgresql://postgres1.host:5432/default?...&${Test/RDS/PostGres1}&...

Konektor menggunakan nama rahasia untuk mengambil rahasia dan memberikan nama pengguna dan kata sandi, seperti pada contoh berikut.

postgres://jdbc:postgresql://postgres1.host:5432/default?...&user=sample2&password=sample2&...

Saat ini, SQL konektor Postgre mengenali dan properti. user password JDBC

Mengaktifkan SSL

Untuk mendukung SSL koneksi Postgre Anda, tambahkan yang berikut ini ke string SQL koneksi Anda:

&sslmode=verify-ca&sslfactory=org.postgresql.ssl.DefaultJavaSSLFactory
Contoh

Contoh string koneksi berikut tidak menggunakanSSL.

postgres://jdbc:postgresql://example-asdf-aurora-postgres-endpoint:5432/asdf?user=someuser&password=somepassword

Untuk mengaktifkanSSL, memodifikasi string sebagai berikut.

postgres://jdbc:postgresql://example-asdf-aurora-postgres-endpoint:5432/asdf?user=someuser&password=somepassword&sslmode=verify-ca&sslfactory=org.postgresql.ssl.DefaultJavaSSLFactory

Menggunakan handler koneksi tunggal

Anda dapat menggunakan metadata koneksi tunggal berikut dan penangan rekaman untuk terhubung ke satu instance Postgre. SQL

Jenis handler Kelas
Handler komposit PostGreSqlCompositeHandler
Penangan metadata PostGreSqlMetadataHandler
Rekam handler PostGreSqlRecordHandler

Parameter handler koneksi tunggal

Parameter Deskripsi
default Wajib. String koneksi default.

Penangan koneksi tunggal mendukung satu instance database dan harus menyediakan parameter string default koneksi. Semua string koneksi lainnya diabaikan.

Properti contoh berikut adalah untuk satu contoh Postgre didukung oleh SQL fungsi Lambda.

Properti Nilai
default postgres://jdbc:postgresql://postgres1.host:5432/default?secret=${Test/RDS/PostgreSQL1}

Parameter tumpahan

Lambda SDK dapat menumpahkan data ke Amazon S3. Semua instance database yang diakses oleh fungsi Lambda yang sama tumpah ke lokasi yang sama.

Parameter Deskripsi
spill_bucket Wajib. Nama ember tumpahan.
spill_prefix Wajib. Tumpahkan key prefix bucket.
spill_put_request_headers (Opsional) Peta header permintaan dan nilai yang JSON dikodekan untuk putObject permintaan Amazon S3 yang digunakan untuk menumpahkan (misalnya,). {"x-amz-server-side-encryption" : "AES256"} Untuk kemungkinan header lainnya, lihat PutObjectdi APIReferensi Layanan Penyimpanan Sederhana Amazon.

Dukungan tipe data

Tabel berikut menunjukkan tipe data yang sesuai untukJDBC, PostGreSQL, dan Panah.

JDBC PostGreSQL Panah
Boolean Boolean Bit
Bilangan Bulat N/A Mungil
Pendek smallint berkulit kecil
Bilangan Bulat integer Int
Long bigint Besar-bigint
float mengapung4 Mengapung4
Ganda mengapung8 Mengapung8
Tanggal tanggal DateDay
Stempel Waktu timestamp DateMilli
String text Varchar
Byte byte Varbiner
BigDecimal numeric(p,s) Decimal
ARRAY N/A (lihat catatan) Daftar
catatan

ARRAYTipe ini didukung untuk SQL konektor Postgre dengan batasan berikut: Array multidimensi (<data_type>[][]atau array bersarang) tidak didukung. Kolom dengan ARRAY tipe data yang tidak didukung dikonversi ke array elemen string (). array<varchar>

Partisi dan split

Partisi digunakan untuk menentukan cara menghasilkan split untuk konektor. Athena membangun kolom sintetis tipe varchar yang mewakili skema partisi untuk tabel untuk membantu konektor menghasilkan split. Konektor tidak mengubah definisi tabel yang sebenarnya.

Kinerja

Postgre SQL mendukung partisi asli. SQLKonektor Athena Postgre dapat mengambil data dari partisi ini secara paralel. Jika Anda ingin menanyakan kumpulan data yang sangat besar dengan distribusi partisi yang seragam, partisi asli sangat disarankan.

SQLKonektor Athena Postgre melakukan pushdown predikat untuk mengurangi data yang dipindai oleh kueri. LIMITklausa, predikat sederhana, dan ekspresi kompleks didorong ke konektor untuk mengurangi jumlah data yang dipindai dan mengurangi waktu eksekusi kueri. Namun, memilih subset kolom terkadang menghasilkan runtime eksekusi kueri yang lebih lama.

LIMITklausa

LIMIT NPernyataan mengurangi data yang dipindai oleh kueri. Dengan LIMIT N pushdown, konektor hanya mengembalikan N baris ke Athena.

Predikat

Predikat adalah ekspresi dalam WHERE klausa SQL kueri yang mengevaluasi nilai Boolean dan memfilter baris berdasarkan beberapa kondisi. SQLKonektor Athena Postgre dapat menggabungkan ekspresi ini dan mendorongnya langsung ke Postgre untuk meningkatkan fungsionalitas dan SQL untuk mengurangi jumlah data yang dipindai.

Operator SQL konektor Athena Postgre berikut mendukung pushdown predikat:

  • Boolean:AND, ATAU, NOT

  • Kesetaraan:EQUAL, NOT _, _EQUAL, LESS _ LESS THAN _OR_THAN, _EQUAL, _ GREATER _ATAU_THAN, GREATER IS_ _, THAN _JIKAEQUAL, DISTINCT IS_ FROM NULL NULL

  • Aritmatika:ADD,,,,SUBTRACT, MULTIPLY DIVIDE MODULUS NEGATE

  • Lainnya: LIKE _PATTERN, IN

Contoh pushdown gabungan

Untuk kemampuan kueri yang ditingkatkan, gabungkan jenis pushdown, seperti pada contoh berikut:

SELECT * FROM my_table WHERE col_a > 10 AND ((col_a + col_b) > (col_c % col_d)) AND (col_e IN ('val1', 'val2', 'val3') OR col_f LIKE '%pattern%') LIMIT 10;

Kueri passthrough

SQLKonektor Postgre mendukung kueri passthrough. Kueri passthrough menggunakan fungsi tabel untuk mendorong kueri lengkap Anda ke sumber data untuk dieksekusi.

Untuk menggunakan kueri passthrough dengan PostgreSQL, Anda dapat menggunakan sintaks berikut:

SELECT * FROM TABLE( system.query( query => 'query string' ))

Contoh query berikut mendorong ke bawah query ke sumber data di SQL Postgre. Kueri memilih semua kolom dalam customer tabel, membatasi hasilnya menjadi 10.

SELECT * FROM TABLE( system.query( query => 'SELECT * FROM customer LIMIT 10' ))

Sumber daya tambahan

Untuk informasi versi JDBC driver terbaru, lihat file pom.xml untuk SQL konektor Postgre di.com. GitHub

Untuk informasi tambahan tentang konektor ini, kunjungi situs terkait GitHub di.com.