Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Integrasi Aurora PostgreSQL yang kompatibel dengan AWS Glue
AWS Glue adalah layanan ekstrak, transformasi, dan pemuatan (ETL) yang dikelola sepenuhnya untuk menyiapkan dan memuat data untuk analitik. Anda dapat mengintegrasikan AWS Glue dengan Amazon Aurora PostgreSQL Edisi yang kompatibel dengan Amazon Aurora untuk setiap alur kerja pemrosesan data dan analitik.
AWS Glue kasus penggunaan dan langkah-langkah tingkat tinggi
Integrasi Aurora PostgreSQL kompatibel dengan AWS Glue mendukung kasus penggunaan berikut:
-
Pergudangan dan analitik data - Gunakan AWS Glue integrasi dengan Aurora PostgreSQL yang kompatibel untuk membangun pergudangan data dan solusi analitik. AWS Glue dapat mengekstrak data dari database yang kompatibel dengan Aurora PostgreSQL, dan mengubahnya sesuai dengan kebutuhan Anda. Kemudian AWS Glue dapat memuat data yang diubah ke gudang data seperti Amazon Redshift atau Amazon Athena untuk analitik dan pelaporan lanjutan.
-
Pembuatan danau data - Gunakan AWS Glue untuk mengekstrak data dari Aurora PostgreSQL yang kompatibel dan memuatnya ke danau data yang disimpan di Amazon S3. Anda kemudian dapat menggunakan data lake ini untuk berbagai tujuan, seperti pembelajaran mesin, eksplorasi data, atau memberi makan sistem analitik lainnya.
-
Pipa ETL - Gunakan layanan ETL AWS Glue tanpa server untuk membangun jaringan pipa data yang kuat. Anda dapat mengekstrak data dari Aurora PostgreSQL kompatibel, dan melakukan transformasi kompleks dengan menggunakan Apache Spark atau. PySpark Anda dapat memuat data yang diproses ke target seperti Amazon S3 atau Amazon Redshift, atau Anda dapat memuatnya kembali ke Aurora PostgreSQL yang kompatibel.
-
Katalogisasi data dan manajemen metadata - Gunakan AWS Glue Data Catalog untuk merayapi dan membuat katalog metadata secara otomatis dari database dan tabel yang kompatibel dengan Aurora PostgreSQL. Layanan AWS seperti Amazon Athena dan Amazon Redshift Spectrum dapat menggunakan repositori metadata terpusat ini untuk menanyakan dan menganalisis data.
-
Persiapan data untuk pembelajaran mesin - Gunakan AWS Glue untuk menyiapkan data dari Aurora PostgreSQL yang kompatibel untuk beban kerja pembelajaran mesin (ML). Data yang diproses dapat dimuat ke Amazon SageMaker AI atau layanan ML lainnya untuk pelatihan dan penerapan model.
-
Migrasi dan replikasi data - Sementara AWS Database Migration Service (AWS DMS) adalah layanan utama untuk migrasi database, Anda juga dapat menggunakan. AWS Glue Migrasi atau replikasi data dari Aurora PostgreSQL yang kompatibel ke penyimpanan data lain, seperti Amazon S3, Amazon Redshift, atau bahkan mesin database lainnya.
Organisasi Anda dapat menggunakan kekuatan integrasi AWS data dan layanan analitik dengan skalabilitas, kinerja, dan kompatibilitas yang kompatibel dengan Aurora PostgreSQL. Dengan kasus penggunaan ini, Anda dapat membangun jalur data yang kuat, melakukan transformasi data yang kompleks, dan berintegrasi dengan yang lain Layanan AWS untuk analitik dan pelaporan lanjutan.
Untuk mengintegrasikan Aurora PostgreSQL kompatibel dengan AWS Glue, gunakan langkah-langkah tingkat tinggi berikut:
-
Masuk ke Konsol Manajemen AWS, navigasikan ke AWS Glue konsol, dan buat file AWS Glue Data Catalog.
Katalog Data adalah repositori pusat yang menyimpan metadata tentang sumber data Anda, termasuk database dan tabel yang kompatibel dengan Aurora PostgreSQL.
-
Buat AWS Glue koneksi.
Arahkan ke halaman Koneksi, dan buat AWS Glue koneksi. Pilih Aurora PostgreSQL yang kompatibel dengan jenis koneksi, dan berikan titik akhir klaster yang kompatibel dengan Aurora PostgreSQL, nama database, dan nama pengguna dan kata sandi database Anda.
-
Merayapi sumber data yang kompatibel dengan Aurora PostgreSQL.
Arahkan ke bagian Crawler, dan buat crawler yang dikonfigurasi untuk menggunakan koneksi yang Anda buat. Tentukan nama database dan tabel yang ingin dirayapi dan disertakan dalam Katalog Data, dan jalankan crawler.
-
Buat dan jalankan pekerjaan AWS Glue ETL.
Arahkan ke bagian Pekerjaan, dan buat pekerjaan ETL untuk mengakses dan menanyakan data dari database Aurora PostgreSQL yang kompatibel dengan menggunakan Katalog Data. Pilih jenis pekerjaan berdasarkan kebutuhan Anda. Dalam skrip pekerjaan ETL, lakukan transformasi atau pemrosesan yang diperlukan, dan tentukan lokasi target untuk data yang diproses. Lokasi target dapat berupa Amazon S3, Amazon Redshift, atau database lain yang kompatibel dengan Aurora PostgreSQL.
Untuk petunjuk rinci, lihat AWS Glue dokumentasi.