Kapan saya harus menggunakan Athena? - Amazon Athena

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Kapan saya harus menggunakan Athena?

Layanan kueri seperti Amazon Athena, gudang data seperti Amazon Redshift, dan kerangka kerja pemrosesan data canggih seperti Amazon EMR semuanya memenuhi kebutuhan dan kasus penggunaan yang berbeda. Panduan berikut dapat membantu Anda memilih satu atau lebih layanan berdasarkan kebutuhan Anda.

Amazon Athena

Athena membantu Anda menganalisis data tidak terstruktur, semi-terstruktur, dan terstruktur yang disimpan di Amazon S3. Contohnya termasuk format data CSV, JSON, atau kolumnar seperti Apache Parquet dan Apache ORC. Anda dapat menggunakan Athena untuk menjalankan kueri ad-hoc menggunakan ANSI SQL, tanpa perlu mengumpulkan atau memuat data ke Athena.

Athena terintegrasi dengan Amazon QuickSight untuk visualisasi data yang mudah. Anda dapat menggunakan Athena untuk menghasilkan laporan atau untuk mengeksplorasi data dengan alat kecerdasan bisnis atau klien SQL yang terhubung dengan driver JDBC atau ODBC. Untuk informasi selengkapnya, lihat Apa itu Amazon QuickSight di Panduan QuickSight Pengguna Amazon danMenghubungkan ke Amazon Athena dengan driver ODBC dan JDBC.

Athena terintegrasi dengan AWS Glue Data Catalog, yang menawarkan penyimpanan metadata persisten untuk data Anda di Amazon S3. Ini memungkinkan Anda untuk membuat tabel dan data kueri di Athena berdasarkan penyimpanan metadata pusat yang tersedia di seluruh akun Amazon Web Services Anda dan terintegrasi dengan ETL dan fitur penemuan data. AWS Glue Untuk informasi selengkapnya, lihat Integrasi dengan AWS Glue dan Apa yang dimaksud AWS Glue dalam AWS Glue Panduan Developer.

Amazon Athena memudahkan menjalankan kueri interaktif terhadap data langsung di Amazon S3 tanpa harus memformat data atau mengelola infrastruktur. Misalnya, Athena berguna jika Anda ingin menjalankan kueri cepat di log web untuk memecahkan masalah kinerja di situs Anda. Dengan Athena, Anda dapat memulai dengan cepat: Anda hanya menentukan tabel untuk data Anda dan mulai melakukan kueri menggunakan SQL standar.

Anda harus menggunakan Amazon Athena jika Anda ingin menjalankan kueri SQL ad hoc interaktif terhadap data di Amazon S3, tanpa harus mengelola infrastruktur atau cluster apa pun. Amazon Athena menyediakan cara termudah untuk menjalankan kueri ad hoc untuk data di Amazon S3 tanpa perlu mengatur atau mengelola server apa pun.

Untuk daftar yang dimanfaatkan atau diintegrasikan Athena, lihat. Layanan AWS Layanan AWS Integrasi dengan Athena

Amazon EMR

Amazon EMR membuatnya sederhana dan hemat biaya untuk menjalankan kerangka kerja pemrosesan yang sangat terdistribusi seperti Hadoop, Spark, dan Presto jika dibandingkan dengan penerapan lokal. Amazon EMR fleksibel — Anda dapat menjalankan aplikasi dan kode khusus, dan menentukan parameter komputasi, memori, penyimpanan, dan aplikasi tertentu untuk mengoptimalkan persyaratan analitik Anda.

Selain menjalankan kueri SQL, Amazon EMR dapat menjalankan berbagai tugas pemrosesan data skala untuk aplikasi seperti pembelajaran mesin, analisis grafik, transformasi data, streaming data, dan hampir semua hal yang dapat Anda kodekan. Anda harus menggunakan Amazon EMR jika Anda menggunakan kode khusus untuk memproses dan menganalisis kumpulan data yang sangat besar dengan kerangka kerja pemrosesan data besar terbaru seperti Spark, Hadoop, Presto, atau Hbase. Amazon EMR memberi Anda kontrol penuh atas konfigurasi cluster Anda dan perangkat lunak yang diinstal pada mereka.

Anda dapat menggunakan Amazon Athena untuk menanyakan data yang Anda proses menggunakan Amazon EMR. Amazon Athena mendukung banyak format data yang sama dengan Amazon EMR. Katalog data Athena kompatibel dengan Hive metastore. Jika Anda menggunakan EMR dan sudah memiliki metastore Hive, Anda dapat menjalankan pernyataan DDL Anda di Amazon Athena dan segera menanyakan data Anda tanpa memengaruhi pekerjaan EMR Amazon Anda.

Amazon Redshift

Gudang data seperti Amazon Redshift adalah pilihan terbaik Anda ketika Anda perlu mengumpulkan data dari berbagai sumber — seperti sistem inventaris, sistem keuangan, dan sistem penjualan ritel — ke dalam format umum, dan menyimpannya untuk jangka waktu yang lama. Jika Anda ingin membuat laporan bisnis canggih dari data historis, maka gudang data seperti Amazon Redshift adalah pilihan terbaik. Mesin kueri di Amazon Redshift telah dioptimalkan untuk berkinerja sangat baik dalam menjalankan kueri kompleks yang menggabungkan sejumlah besar tabel database yang sangat besar. Saat Anda perlu menjalankan kueri terhadap data yang sangat terstruktur dengan banyak gabungan di banyak tabel yang sangat besar, pilih Amazon Redshift.

Untuk informasi lebih lanjut tentang kapan harus menggunakan Athena, lihat sumber daya berikut: