Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Konektor Amazon Athena Oracle
Konektor Amazon Athena untuk Oracle memungkinkan Amazon Athena menjalankan kueri SQL pada data yang disimpan di Oracle yang berjalan di lokasi atau di Amazon atau Amazon RDS. EC2 Anda juga dapat menggunakan konektor untuk menanyakan data pada Oracle exadata
Konektor ini tidak dapat didaftarkan dengan Glue Data Catalog sebagai katalog federasi. Konektor ini tidak mendukung kontrol akses data yang ditentukan dalam Lake Formation di tingkat katalog, database, tabel, kolom, baris, dan tag. Konektor ini menggunakan Glue Connections untuk memusatkan properti konfigurasi di Glue.
Prasyarat
Menyebarkan konektor ke Anda Akun AWS menggunakan konsol Athena atau. AWS Serverless Application Repository Untuk informasi selengkapnya, lihat Buat koneksi sumber data atau Gunakan AWS Serverless Application Repository untuk menyebarkan konektor sumber data.
Batasan
-
Menulis operasi DDL tidak didukung.
-
Dalam pengaturan multiplexer, bucket tumpahan dan awalan dibagikan di semua instance database.
-
Batas Lambda yang relevan. Untuk informasi selengkapnya, lihat Kuota Lambda dalam Panduan Pengembang AWS Lambda .
-
Hanya versi 12.1.0.2 Oracle Database yang didukung.
-
Jika konektor Oracle tidak menggunakan koneksi Glue, nama database, tabel, dan kolom akan dikonversi ke huruf besar oleh konektor.
Jika konektor Oracle menggunakan koneksi Glue, database, tabel, dan nama kolom tidak akan default ke huruf besar oleh konektor. Tambahkan tanda kutip ganda (“) di sekitar nama objek untuk melestarikan kasus. Untuk mengubah perilaku casing ini, ubah Lambda menurut variabel lingkungan
casing_mode
menjadiupper
ataulower
sesuai kebutuhan.
Ketentuan
Istilah-istilah berikut berhubungan dengan konektor Oracle.
-
Instance Database — Instance apa pun dari database yang digunakan di tempat, di Amazon EC2, atau di Amazon RDS.
-
Handler - Handler Lambda yang mengakses instance database Anda. Handler bisa untuk metadata atau untuk catatan data.
-
Metadata handler — Penangan Lambda yang mengambil metadata dari instance database Anda.
-
Record handler - Handler Lambda yang mengambil catatan data dari instance database Anda.
-
Composite handler — Handler Lambda yang mengambil data metadata dan data dari instance database Anda.
-
Properti atau parameter - Properti database yang digunakan oleh penangan untuk mengekstrak informasi database. Anda mengonfigurasi properti ini sebagai variabel lingkungan Lambda.
-
Connection String — Sebuah string teks yang digunakan untuk membuat koneksi ke instance database.
-
Katalog —AWS Glue Non-katalog yang terdaftar di Athena yang merupakan awalan yang diperlukan untuk properti.
connection_string
-
Multiplexing handler - Handler Lambda yang dapat menerima dan menggunakan beberapa koneksi database.
Parameter
Gunakan parameter di bagian ini untuk mengkonfigurasi konektor Oracle.
catatan
Konektor sumber data Athena dibuat pada 3 Desember 2024 dan kemudian menggunakan koneksi. AWS Glue
Nama parameter dan definisi yang tercantum di bawah ini adalah untuk konektor sumber data Athena yang dibuat sebelum 3 Desember 2024. Ini dapat berbeda dari properti AWS Glue koneksi yang sesuai. Mulai 3 Desember 2024, gunakan parameter di bawah ini hanya jika Anda menggunakan konektor sumber data Athena versi sebelumnya secara manual.
String koneksi
Gunakan string koneksi JDBC dalam format berikut untuk terhubung ke instance database.
oracle://${
jdbc_connection_string
}
catatan
Jika kata sandi Anda berisi karakter khusus (misalnya,some.password
), lampirkan kata sandi Anda dalam tanda kutip ganda saat Anda meneruskannya ke string koneksi (misalnya,"some.password"
). Kegagalan untuk melakukannya dapat mengakibatkan kesalahan yang ditentukan URL Oracle Tidak Valid
.
Menggunakan handler multiplexing
Anda dapat menggunakan multiplexer untuk terhubung ke beberapa instance database dengan satu fungsi Lambda. Permintaan dirutekan dengan nama katalog. Gunakan kelas berikut di Lambda.
Handler | Kelas |
---|---|
Handler komposit | OracleMuxCompositeHandler |
Penangan metadata | OracleMuxMetadataHandler |
Rekam handler | OracleMuxRecordHandler |
Parameter handler multiplexing
Parameter | Deskripsi |
---|---|
$ |
Wajib. Sebuah string koneksi instance database. Awalan variabel lingkungan dengan nama katalog yang digunakan di Athena. Misalnya, jika katalog terdaftar di Athena adalahmyoraclecatalog , maka nama variabel lingkungan adalah. myoraclecatalog_connection_string |
default |
Wajib. String koneksi default. String ini digunakan saat katalognya lambda:${ AWS_LAMBDA_FUNCTION_NAME } . |
Contoh properti berikut adalah untuk fungsi Oracle MUX Lambda yang mendukung dua instance database: oracle1
(default), dan. oracle2
Properti | Nilai |
---|---|
default |
oracle://jdbc:oracle:thin:${Test/RDS/Oracle1}@//oracle1.hostname:port/servicename |
oracle_catalog1_connection_string |
oracle://jdbc:oracle:thin:${Test/RDS/Oracle1}@//oracle1.hostname:port/servicename |
oracle_catalog2_connection_string |
oracle://jdbc:oracle:thin:${Test/RDS/Oracle2}@//oracle2.hostname:port/servicename |
Memberikan kredensi
Untuk memberikan nama pengguna dan kata sandi untuk database Anda dalam string koneksi JDBC Anda, Anda dapat menggunakan properti string koneksi atau. AWS Secrets Manager
-
Connection String - Nama pengguna dan kata sandi dapat ditentukan sebagai properti dalam string koneksi JDBC.
penting
Sebagai praktik keamanan terbaik, jangan gunakan kredensyal hardcode dalam variabel lingkungan atau string koneksi Anda. Untuk informasi tentang memindahkan rahasia hardcode Anda AWS Secrets Manager, lihat Memindahkan rahasia hardcode ke AWS Secrets Manager dalam Panduan Pengguna.AWS Secrets Manager
-
AWS Secrets Manager— Untuk menggunakan fitur Query Federasi Athena dengan, VPC AWS Secrets Manager yang terhubung ke fungsi Lambda Anda harus memiliki akses internet atau
titik akhir VPC untuk terhubung ke Secrets Manager. Anda dapat memasukkan nama rahasia ke AWS Secrets Manager dalam string koneksi JDBC Anda. Konektor menggantikan nama rahasia dengan
password
nilaiusername
dan dari Secrets Manager.Untuk instans database Amazon RDS, dukungan ini terintegrasi erat. Jika Anda menggunakan Amazon RDS, kami sangat menyarankan penggunaan AWS Secrets Manager dan rotasi kredensyal. Jika database Anda tidak menggunakan Amazon RDS, simpan kredensialnya sebagai JSON dalam format berikut:
{"username": "${username}", "password": "${password}"}
catatan
Jika kata sandi Anda berisi karakter khusus (misalnya,some.password
), lampirkan kata sandi Anda dalam tanda kutip ganda saat Anda menyimpannya di Secrets Manager (misalnya,"some.password"
). Kegagalan untuk melakukannya dapat mengakibatkan kesalahan yang ditentukan URL Oracle Tidak Valid
.
Contoh string koneksi dengan nama rahasia
String berikut memiliki nama rahasia${Test/RDS/Oracle}
.
oracle://jdbc:oracle:thin:${Test/RDS/Oracle}@//hostname:port/servicename
Konektor menggunakan nama rahasia untuk mengambil rahasia dan memberikan nama pengguna dan kata sandi, seperti pada contoh berikut.
oracle://jdbc:oracle:thin:username/password@//hostname:port/servicename
Saat ini, konektor Oracle mengenali properti UID
dan PWD
JDBC.
Menggunakan handler koneksi tunggal
Anda dapat menggunakan metadata koneksi tunggal berikut dan penangan rekaman untuk terhubung ke satu instance Oracle.
Jenis handler | Kelas |
---|---|
Handler komposit | OracleCompositeHandler |
Penangan metadata | OracleMetadataHandler |
Rekam handler | OracleRecordHandler |
Parameter handler koneksi tunggal
Parameter | Deskripsi |
---|---|
default |
Wajib. String koneksi default. |
IsFIPSEnabled |
Tidak wajib. Setel ke true saat mode FIPS diaktifkan. Default-nya adalah false . |
Penangan koneksi tunggal mendukung satu instance database dan harus menyediakan parameter string default
koneksi. Semua string koneksi lainnya diabaikan.
Konektor mendukung koneksi berbasis SSL ke instans Amazon RDS. Support terbatas pada protokol Transport Layer Security (TLS) dan otentikasi server oleh klien. Otentikasi timbal balik itu tidak didukung di Amazon RDS. Baris kedua dalam tabel di bawah ini menunjukkan sintaks untuk menggunakan SSL.
Properti contoh berikut adalah untuk satu contoh Oracle didukung oleh fungsi Lambda.
Properti | Nilai |
---|---|
default |
oracle://jdbc:oracle:thin:${Test/RDS/Oracle}@//hostname:port/servicename |
oracle://jdbc:oracle:thin:${Test/RDS/Oracle}@(DESCRIPTION=(ADDRESS=(PROTOCOL=TCPS)
(HOST=<HOST_NAME>)(PORT=))(CONNECT_DATA=(SID=))(SECURITY=(SSL_SERVER_CERT_DN=))) |
Parameter tumpahan
Lambda SDK dapat menumpahkan data ke Amazon S3. Semua instance database yang diakses oleh fungsi Lambda yang sama tumpah ke lokasi yang sama.
Parameter | Deskripsi |
---|---|
spill_bucket |
Wajib. Nama ember tumpahan. |
spill_prefix |
Wajib. Tumpahkan key prefix bucket. |
spill_put_request_headers |
(Opsional) Peta header permintaan dan nilai yang disandikan JSON untuk permintaan Amazon S3 yang digunakan untuk menumpahkan (misalnya,). putObject {"x-amz-server-side-encryption" :
"AES256"} Untuk kemungkinan header lainnya, lihat PutObjectdi Referensi API Amazon Simple Storage Service. |
Casing
Anda dapat menggunakan parameter casing berikut untuk mengatur mode casing yang berbeda. Anda dapat mengubah mode casing default di variabel lingkungan Lambda untuk konektor Anda terlepas dari koneksi lem.
-
casing_mode - (Opsional) Menentukan bagaimana menangani casing untuk skema dan nama tabel.
casing_mode
Parameter menggunakan nilai-nilai berikut untuk menentukan perilaku casing:-
lebih rendah - Huruf kecil semua skema dan nama tabel yang diberikan. Ini adalah default untuk konektor yang memiliki koneksi lem terkait.
-
atas - Huruf besar semua skema dan nama tabel yang diberikan. Ini adalah default untuk konektor yang tidak memiliki koneksi lem terkait.
-
case_insensitive_search — Lakukan pencarian case insensitive terhadap skema dan nama tabel di Oracle. Gunakan nilai ini jika kueri Anda berisi skema atau nama tabel yang tidak cocok dengan casing default untuk konektor Anda.
-
Dukungan tipe data
Tabel berikut menunjukkan tipe data yang sesuai untuk JDBC, Oracle, dan Arrow.
JDBC | Oracle | Panah |
---|---|---|
Boolean | boolean | Bit |
Bilangan Bulat | N/A | Mungil |
Pendek | smallint | Orang kecil |
Bilangan Bulat | integer | Int |
Long | bigint | Bigint |
float | mengapung4 | Mengapung4 |
Ganda | mengapung8 | Mengapung8 |
Tanggal | tanggal | DateDay |
Stempel Waktu | timestamp | DateMilli |
String | text | Varchar |
Byte | byte | Varbiner |
BigDecimal | numeric(p,s) | Decimal |
ARRAY | N/A (lihat catatan) | Daftar |
Partisi dan split
Partisi digunakan untuk menentukan cara menghasilkan split untuk konektor. Athena membangun kolom sintetis tipe varchar
yang mewakili skema partisi untuk tabel untuk membantu konektor menghasilkan split. Konektor tidak mengubah definisi tabel yang sebenarnya.
Kinerja
Oracle mendukung partisi asli. Konektor Athena Oracle dapat mengambil data dari partisi ini secara paralel. Jika Anda ingin menanyakan kumpulan data yang sangat besar dengan distribusi partisi yang seragam, partisi asli sangat disarankan. Memilih subset kolom secara signifikan mempercepat runtime kueri dan mengurangi data yang dipindai. Konektor Oracle tahan terhadap pelambatan karena konkurensi. Namun, runtime kueri cenderung panjang.
Konektor Athena Oracle melakukan pushdown predikat untuk mengurangi data yang dipindai oleh kueri. Predikat sederhana dan ekspresi kompleks didorong ke konektor untuk mengurangi jumlah data yang dipindai dan mengurangi waktu eksekusi kueri.
Predikat
Predikat adalah ekspresi dalam WHERE
klausa kueri SQL yang mengevaluasi nilai Boolean dan menyaring baris berdasarkan beberapa kondisi. Konektor Athena Oracle dapat menggabungkan ekspresi ini dan mendorongnya langsung ke Oracle untuk meningkatkan fungsionalitas dan untuk mengurangi jumlah data yang dipindai.
Operator konektor Athena Oracle berikut mendukung pushdown predikat:
-
Boolean: DAN, ATAU, TIDAK
-
KESETARAAN: SAMA, NOT_EQUAL, LESS_THAN, LESS_THAN_OR_EQUAL, GREATER_THAN, GREATER_THAN_OR_EQUAL, IS_NULL
-
Aritmatika: TAMBAHKAN, KURANGI, KALIKAN, BAGI, MENIADAKAN
-
Lainnya: LIKE_PATTERN, IN
Contoh pushdown gabungan
Untuk kemampuan kueri yang ditingkatkan, gabungkan jenis pushdown, seperti pada contoh berikut:
SELECT * FROM my_table WHERE col_a > 10 AND ((col_a + col_b) > (col_c % col_d)) AND (col_e IN ('val1', 'val2', 'val3') OR col_f LIKE '%pattern%');
Kueri passthrough
Konektor Oracle mendukung kueri passthrough. Kueri passthrough menggunakan fungsi tabel untuk mendorong kueri lengkap Anda ke sumber data untuk dieksekusi.
Untuk menggunakan kueri passthrough dengan Oracle, Anda dapat menggunakan sintaks berikut:
SELECT * FROM TABLE( system.query( query => '
query string
' ))
Contoh query berikut mendorong ke bawah query ke sumber data di Oracle. Query memilih semua kolom dalam customer
tabel.
SELECT * FROM TABLE( system.query( query => 'SELECT * FROM customer' ))
Informasi lisensi
Dengan menggunakan konektor ini, Anda mengakui penyertaan komponen pihak ketiga, daftar yang dapat ditemukan dalam file pom.xml
Sumber daya tambahan
Untuk informasi versi driver JDBC terbaru, lihat file pom.xml
Untuk informasi tambahan tentang konektor ini, kunjungi situs terkait