Konektor Amazon Athena Neptunus - Amazon Athena

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Konektor Amazon Athena Neptunus

Amazon Neptune adalah layanan basis data grafik yang cepat, andal, terkelola penuh yang memudahkan membangun dan menjalankan aplikasi yang bekerja dengan set data yang sangat terhubung. Neptunus yang dibuat khusus, mesin basis data grafik berperforma tinggi menyimpan miliaran hubungan secara optimal dan grafik kueri dengan latensi hanya milidetik. Untuk informasi selengkapnya, lihat Panduan Pengguna Neptune.

Konektor Neptunus Amazon Athena memungkinkan Athena berkomunikasi dengan instans database grafik Neptunus Anda, membuat data grafik Neptunus Anda dapat diakses oleh kueri. SQL

Konektor ini tidak menggunakan Glue Connections untuk memusatkan properti konfigurasi di Glue. Konfigurasi koneksi dilakukan melalui Lambda.

Jika Anda mengaktifkan Lake Formation di akun Anda, IAM peran untuk konektor Lambda federasi Athena yang Anda gunakan harus memiliki akses baca AWS Serverless Application Repository di Lake Formation ke. AWS Glue Data Catalog

Prasyarat

Menggunakan konektor Neptunus membutuhkan tiga langkah berikut.

Batasan

Saat ini, Konektor Neptunus memiliki batasan berikut.

  • Memproyeksikan kolom, termasuk kunci utama (ID), tidak didukung.

Menyiapkan cluster Neptunus

Jika Anda tidak memiliki cluster Amazon Neptunus dan kumpulan data grafik properti di dalamnya yang ingin Anda gunakan, Anda harus mengaturnya.

Pastikan Anda memiliki gateway internet dan NAT gateway di tempat VPC yang menampung cluster Neptunus Anda. Subnet pribadi yang digunakan oleh fungsi Lambda konektor Neptunus harus memiliki rute ke internet melalui Gateway ini. NAT Fungsi Lambda konektor Neptunus NAT menggunakan Gateway untuk berkomunikasi dengannya. AWS Glue

Untuk petunjuk cara menyiapkan kluster Neptunus baru dan memuatnya dengan kumpulan data sampel, lihat Contoh Pengaturan Kluster Neptunus di.com. GitHub

Menyiapkan AWS Glue Data Catalog

Tidak seperti penyimpanan data relasional tradisional, node dan tepi DB grafik Neptunus tidak menggunakan skema yang ditetapkan. Setiap entri dapat memiliki bidang dan tipe data yang berbeda. Namun, karena konektor Neptunus mengambil metadata dari, Anda harus membuat database AWS Glue Data Catalog yang memiliki tabel AWS Glue dengan skema yang diperlukan. Setelah Anda membuat AWS Glue database dan tabel, konektor dapat mengisi daftar tabel yang tersedia untuk kueri dari Athena.

Mengaktifkan pencocokan kolom case insensitive

Untuk menyelesaikan nama kolom dari tabel Neptunus Anda dengan casing yang benar bahkan ketika nama kolom semuanya lebih rendah, Anda dapat mengonfigurasi konektor Neptunus untuk AWS Glue pencocokan yang tidak peka huruf besar/kecil.

Untuk mengaktifkan fitur ini, atur variabel lingkungan fungsi konektor Neptunus Lambda ke. enable_caseinsensitivematch true

Menentukan parameter tabel AWS Glue glabel untuk nama tabel cased

Karena hanya AWS Glue mendukung nama tabel huruf kecil, penting untuk menentukan parameter glabel AWS Glue tabel saat Anda membuat tabel untuk Neptunus dan nama AWS Glue tabel Neptunus Anda menyertakan casing.

Dalam definisi AWS Glue tabel Anda, sertakan glabel parameter dan atur nilainya ke nama tabel Anda dengan casing aslinya. Ini memastikan bahwa casing yang benar dipertahankan saat AWS Glue berinteraksi dengan tabel Neptunus Anda. Contoh berikut menetapkan nilai glabel untuk nama tabelAirport.

glabel = Airport
Mengatur properti glabel AWS Glue tabel untuk mempertahankan casing nama tabel untuk tabel Neptunus

Untuk informasi selengkapnya tentang pengaturan AWS Glue Data Catalog untuk bekerja dengan Neptunus, lihat AWS Glue Mengatur Katalog di.com. GitHub

Kinerja

Konektor Athena Neptunus melakukan pushdown predikat untuk mengurangi data yang dipindai oleh kueri. Namun, predikat yang menggunakan kunci utama mengakibatkan kegagalan kueri. LIMITklausa mengurangi jumlah data yang dipindai, tetapi jika Anda tidak memberikan predikat, Anda harus mengharapkan SELECT kueri dengan LIMIT klausa untuk memindai setidaknya 16 MB data. Konektor Neptunus tahan terhadap pelambatan karena konkurensi.

Kueri passthrough

Konektor Neptunus mendukung kueri passthrough. Anda dapat menggunakan fitur ini untuk menjalankan kueri Gremlin pada grafik properti dan untuk menjalankan SPARQL kueri pada data. RDF

Untuk membuat kueri passthrough dengan Neptunus, gunakan sintaks berikut:

SELECT * FROM TABLE( system.query( DATABASE => 'database_name', COLLECTION => 'collection_name', QUERY => 'query_string' ))

Berikut contoh filter query passthrough Neptunus untuk bandara dengan kode. ATL Kutipan tunggal berlipat ganda adalah untuk melarikan diri.

SELECT * FROM TABLE( system.query( DATABASE => 'graph-database', COLLECTION => 'airport', QUERY => 'g.V().has(''airport'', ''code'', ''ATL'').valueMap()' ))

Sumber daya tambahan

Untuk informasi tambahan tentang konektor ini, kunjungi situs terkait GitHub di.com.