Memulai gudang data yang disediakan Amazon Redshift - Amazon Redshift

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memulai gudang data yang disediakan Amazon Redshift

Jika Anda adalah pengguna pertama kali Amazon Redshift, kami sarankan Anda membaca bagian berikut untuk membantu Anda mulai menggunakan kluster yang disediakan. Alur dasar Amazon Redshift adalah membuat sumber daya yang disediakan, terhubung ke Amazon Redshift, memuat data sampel, dan kemudian menjalankan kueri pada data. Dalam panduan ini, Anda dapat memilih untuk memuat data sampel dari Amazon Redshift atau dari bucket Amazon S3. Data sampel digunakan di seluruh dokumentasi Amazon Redshift untuk mendemonstrasikan fitur.

Tutorial ini menunjukkan cara menggunakan kluster yang disediakan Amazon Redshift, yang merupakan objek gudang data tempat AWS Anda mengelola sumber daya sistem. Anda juga dapat menggunakan Amazon Redshift dengan grup kerja tanpa server, yang merupakan objek gudang data yang diskalakan secara otomatis sebagai respons terhadap penggunaan. Untuk mulai menggunakan Redshift Serverless, lihat. Memulai dengan gudang data Amazon Redshift Tanpa Server

Setelah membuat dan masuk ke konsol yang disediakan Amazon Redshift, Anda dapat membuat dan mengelola objek Amazon Redshift, termasuk cluster, node, dan database. Anda juga dapat menjalankan kueri, melihat kueri, dan melakukan operasi bahasa definisi SQL data (DDL) dan bahasa manipulasi data (DML) lainnya dengan SQL klien.

penting

Cluster yang Anda sediakan untuk latihan ini berjalan di lingkungan hidup. Selama itu berjalan, itu menimbulkan biaya untuk Anda. Akun AWS Untuk informasi harga, lihat halaman harga Amazon Redshift.

Untuk menghindari biaya yang tidak perlu, hapus klaster Anda setelah selesai melakukannya. Bagian terakhir dari pasal ini menjelaskan bagaimana melakukannya.

Masuk ke AWS Management Console dan buka konsol Amazon Redshift di. https://console.aws.amazon.com/redshiftv2/

Kami menyarankan Anda memulai dengan membuka dasbor cluster yang disediakan untuk mulai menggunakan konsol Amazon Redshift.

Bergantung pada konfigurasi Anda, item berikut akan muncul di panel navigasi konsol yang disediakan Amazon Redshift:

  • Redshift Tanpa Server — Akses dan analisis data tanpa perlu menyiapkan, menyetel, dan mengelola klaster yang disediakan Amazon Redshift.

  • Dasbor kluster yang disediakan — Lihat daftar cluster di Anda Wilayah AWS, periksa Metrik klaster dan ikhtisar kueri untuk wawasan data metrik (seperti pemanfaatan) dan informasi kueri. CPU Menggunakan ini dapat membantu Anda menentukan apakah data kinerja Anda tidak normal selama rentang waktu tertentu.

  • Cluster — Lihat daftar cluster Anda dalam hal ini Wilayah AWS, pilih klaster untuk memulai kueri, atau melakukan tindakan terkait cluster. Anda juga dapat membuat cluster baru dari halaman ini.

  • Editor kueri — Jalankan kueri pada database yang dihosting di klaster Amazon Redshift Anda. Kami merekomendasikan menggunakan Query editor v2 sebagai gantinya.

  • Editor kueri v2 - Editor kueri Amazon Redshift v2 adalah aplikasi SQL klien berbasis web terpisah untuk membuat dan menjalankan kueri di gudang data Amazon Redshift Anda. Anda dapat memvisualisasikan hasil Anda dalam bagan dan berkolaborasi dengan membagikan pertanyaan Anda dengan orang lain di tim Anda.

  • Kueri dan beban — Dapatkan informasi untuk referensi atau pemecahan masalah, seperti daftar kueri terbaru dan SQL teks untuk setiap kueri.

  • Datashares — Sebagai administrator akun produsen, otorisasi akun konsumen untuk mengakses datashares atau memilih untuk tidak mengotorisasi akses. Untuk menggunakan datashare resmi, administrator akun konsumen dapat mengaitkan datashare dengan seluruh Akun AWS atau ruang nama klaster tertentu dalam akun. Administrator juga dapat menolak datashare.

  • ETLIntegrasi nol - Kelola integrasi yang membuat data transaksional tersedia di Amazon Redshift setelah ditulis dalam sumber yang didukung.

  • IAMKoneksi Pusat Identitas — Konfigurasikan koneksi antara Amazon Redshift dan IAM Identity Center.

  • Konfigurasi - Hubungkan ke cluster Amazon Redshift SQL dari alat klien melalui koneksi Java Database Connectivity JDBC () dan Open Database Connectivity ODBC (). Anda juga dapat mengatur titik akhir cloud () virtual private cloud () yang dikelola Amazon Redshift. VPC Melakukannya menyediakan koneksi pribadi antara VPC layanan VPC berbasis Amazon yang berisi cluster dan lainnya VPC yang menjalankan alat klien.

  • AWS Integrasi Mitra - Buat integrasi dengan AWS Mitra yang didukung.

  • Penasihat — Dapatkan rekomendasi spesifik tentang perubahan yang dapat Anda lakukan pada klaster Amazon Redshift untuk memprioritaskan pengoptimalan Anda.

  • AWS Marketplace — Dapatkan informasi tentang alat atau AWS layanan lain yang berfungsi dengan Amazon Redshift.

  • Alarm — Buat alarm pada metrik klaster untuk melihat data kinerja dan melacak metrik selama periode waktu yang Anda tentukan.

  • Acara — Lacak peristiwa dan dapatkan laporan tentang informasi seperti tanggal peristiwa terjadi, deskripsi, atau sumber acara.

  • Apa yang baru - Lihat fitur Amazon Redshift baru dan pembaruan produk.

Dalam tutorial ini, Anda melakukan langkah-langkah berikut.

Langkah-langkah dalam tutorial ini, diuraikan berikut

Mendaftar untuk AWS

Jika Anda belum memilikinya Akun AWS, daftarlah untuk satu. Jika Anda sudah memiliki akun, Anda dapat melewati prasyarat ini dan menggunakan akun yang ada.

  1. Buka https://portal.aws.amazon.com/billing/pendaftaran.

  2. Ikuti petunjuk online.

    Bagian dari prosedur pendaftaran melibatkan tindakan menerima panggilan telepon dan memasukkan kode verifikasi di keypad telepon.

    Saat Anda mendaftar untuk sebuah Akun AWS, sebuah Pengguna root akun AWSdibuat. Pengguna root memiliki akses ke semua Layanan AWS dan sumber daya di akun. Sebagai praktik keamanan terbaik, tetapkan akses administratif ke pengguna, dan gunakan hanya pengguna root untuk melakukan tugas yang memerlukan akses pengguna root.

Tentukan aturan firewall

catatan

Tutorial ini mengasumsikan cluster Anda menggunakan port default 5439 dan Amazon Redshift query editor v2 dapat digunakan untuk menjalankan perintah. SQL Itu tidak masuk ke rincian tentang konfigurasi jaringan atau menyiapkan SQL klien yang mungkin diperlukan di lingkungan Anda.

Di beberapa lingkungan, Anda menentukan port saat meluncurkan klaster Amazon Redshift. Anda menggunakan port ini bersama dengan titik akhir cluster URL untuk mengakses cluster. Anda juga membuat aturan masuk masuk dalam grup keamanan untuk mengizinkan akses melalui port ke klaster Anda.

Jika komputer klien Anda berada di belakang firewall, pastikan Anda mengetahui port terbuka yang dapat Anda gunakan. Menggunakan port terbuka ini, Anda dapat terhubung ke cluster dari alat SQL klien dan menjalankan kueri. Jika Anda tidak tahu port terbuka, bekerja dengan seseorang yang memahami aturan firewall jaringan Anda untuk menentukan port terbuka di firewall Anda.

Meskipun Amazon Redshift menggunakan port 5439 secara default, koneksi tidak berfungsi jika port itu tidak terbuka di firewall Anda. Anda tidak dapat mengubah nomor port untuk klaster Amazon Redshift setelah dibuat. Jadi, pastikan Anda menentukan port terbuka yang berfungsi di lingkungan Anda selama proses peluncuran.

Langkah 1: Buat contoh cluster Amazon Redshift

Dalam tutorial ini, Anda berjalan melalui proses untuk membuat cluster Amazon Redshift dengan database. Kemudian Anda memuat kumpulan data dari Amazon S3 ke tabel di database Anda. Anda dapat menggunakan contoh cluster ini untuk mengevaluasi layanan Amazon Redshift.

Sebelum Anda mulai menyiapkan cluster Amazon Redshift, pastikan Anda menyelesaikan prasyarat yang diperlukan seperti dan. Mendaftar untuk AWS Tentukan aturan firewall

Untuk setiap operasi yang mengakses data dari AWS sumber daya lain, klaster Anda memerlukan izin untuk mengakses sumber daya dan data pada sumber daya atas nama Anda. Contohnya adalah menggunakan SQL COPY perintah untuk memuat data dari Amazon Simple Storage Service (Amazon S3). Anda memberikan izin tersebut dengan menggunakan AWS Identity and Access Management (IAM). Anda dapat melakukan ini melalui IAM peran yang Anda buat dan lampirkan ke cluster Anda. Untuk informasi selengkapnya tentang kredensil dan izin akses, lihat Kredensial dan izin akses di Panduan Pengembang Database Amazon Redshift.

Untuk membuat cluster Amazon Redshift
  1. Masuk ke AWS Management Console dan buka konsol Amazon Redshift di. https://console.aws.amazon.com/redshiftv2/

    penting

    Jika Anda menggunakan kredensi IAM pengguna, pastikan Anda memiliki izin yang diperlukan untuk melakukan operasi klaster. Untuk informasi selengkapnya, lihat Keamanan di Amazon Redshift di Panduan Manajemen Pergeseran Merah Amazon.

  2. Di AWS konsol, pilih Wilayah AWS tempat Anda ingin membuat cluster.

  3. Pada menu navigasi, pilih Clusters, lalu pilih Create cluster. Halaman Create cluster muncul.

  4. Di bagian Konfigurasi cluster, tentukan nilai untuk pengidentifikasi Cluster, tipe Node, dan Node:

    • Cluster identifier: Masukkan examplecluster untuk tutorial ini. Pengenal ini harus unik. Pengenal harus dari 1-63 karakter menggunakan karakter yang valid a—z (hanya huruf kecil) dan - (tanda hubung).

    • Pilih salah satu metode berikut untuk mengukur cluster Anda:

      catatan

      Langkah berikut mengasumsikan Wilayah AWS yang mendukung tipe RA3 node. Untuk daftar jenis RA3 node pendukung Wilayah AWS tersebut, lihat Ringkasan jenis RA3 node di Panduan Manajemen Amazon Redshift. Untuk mempelajari lebih lanjut tentang spesifikasi node untuk setiap jenis dan ukuran node, lihat Detail tipe Node.

      • Jika Anda tidak tahu seberapa besar ukuran cluster Anda, pilih Bantu saya pilih. Melakukan hal itu membuka kalkulator ukuran yang menanyakan pertanyaan tentang ukuran dan karakteristik kueri data yang Anda rencanakan untuk disimpan di gudang data Anda.

        Jika Anda mengetahui ukuran cluster Anda yang diperlukan (yaitu, jenis node dan jumlah node), pilih yang akan saya pilih. Kemudian pilih jenis Node dan jumlah Node untuk mengukur cluster Anda.

        Untuk tutorial ini, pilih ra3.4xlarge untuk tipe Node dan 2 untuk Jumlah node.

        Jika pilihan untuk konfigurasi AZ tersedia, pilih Single-AZ.

      • Untuk menggunakan kumpulan data sampel yang disediakan Amazon Redshift, dalam Data sampel, pilih Muat data sampel. Amazon Redshift memuat kumpulan data sampel Tickit ke database dan skema defaultdev. public

  5. Di bagian konfigurasi Database, tentukan nilai untuk nama pengguna Admin. Untuk kata sandi Admin, pilih dari opsi berikut:

    • Buat kata sandi — Gunakan kata sandi yang dihasilkan oleh Amazon Redshift.

    • Tambahkan kata sandi admin secara manual — Gunakan kata sandi Anda sendiri.

    • Kelola kredensi admin di AWS Secrets Manager — Amazon Redshift AWS Secrets Manager menggunakan untuk membuat dan mengelola kata sandi admin Anda. Menggunakan AWS Secrets Manager untuk menghasilkan dan mengelola rahasia kata sandi Anda menimbulkan biaya. Untuk informasi tentang AWS Secrets Manager harga, lihat AWS Secrets Manager Harga.

    Untuk tutorial ini, gunakan nilai-nilai ini:

    • Nama pengguna admin: Enterawsuser.

    • Kata sandi pengguna admin: Masukkan Changeit1 kata sandi.

  6. Untuk tutorial ini, buat IAM peran dan atur sebagai default untuk cluster Anda, seperti yang dijelaskan berikut. Hanya ada satu set IAM peran default untuk sebuah cluster.

    1. Di bawah Izin klaster, untuk Kelola IAM peran, pilih Buat IAM peran.

    2. Tentukan bucket Amazon S3 agar IAM peran dapat diakses dengan salah satu metode berikut:

      • Pilih Tidak ada bucket Amazon S3 tambahan untuk mengizinkan IAM peran yang dibuat hanya mengakses bucket Amazon S3 yang diberi nama sebagai. redshift

      • Pilih Bucket Amazon S3 apa pun untuk memungkinkan IAM peran yang dibuat mengakses semua bucket Amazon S3.

      • Pilih Bucket Amazon S3 Spesifik untuk menentukan satu atau beberapa bucket Amazon S3 agar peran yang dibuat dapat diakses. IAM Kemudian pilih satu atau lebih ember Amazon S3 dari tabel.

    3. Pilih Buat IAM peran sebagai default. Amazon Redshift secara otomatis membuat dan menetapkan IAM peran sebagai default untuk klaster Anda.

      Karena Anda membuat IAM peran Anda dari konsol, itu memiliki AmazonRedshiftAllCommandsFullAccess kebijakan yang dilampirkan. Hal ini memungkinkan Amazon Redshift untuk menyalin, memuat, menanyakan, dan menganalisis data dari sumber daya Amazon di akun AndaIAM.

    Untuk informasi tentang cara mengelola IAM peran default untuk klaster, lihat Membuat IAM peran sebagai default untuk Amazon Redshift di Panduan Manajemen Pergeseran Merah Amazon.

  7. (Opsional) Di bagian Konfigurasi tambahan, matikan Gunakan default untuk mengubah pengaturan Jaringan dan keamanan, konfigurasi Database, Pemeliharaan, Pemantauan, dan Pencadangan.

    Dalam beberapa kasus, Anda dapat membuat klaster dengan opsi Muat data sampel dan ingin mengaktifkan VPC perutean Amazon yang disempurnakan. Jika demikian, klaster di cloud pribadi virtual (VPC) Anda memerlukan akses ke titik akhir Amazon S3 agar data dimuat.

    Untuk membuat cluster dapat diakses publik, Anda dapat melakukan salah satu dari dua hal. Anda dapat mengonfigurasi alamat terjemahan alamat jaringan (NAT) di kluster Anda VPC untuk mengakses internet. Atau Anda dapat mengonfigurasi VPC titik akhir Amazon S3 di. VPC Untuk informasi selengkapnya tentang VPC perutean Amazon yang disempurnakan, lihat VPCPerutean Amazon yang disempurnakan di Panduan Manajemen Pergeseran Merah Amazon.

  8. Pilih Buat klaster. Tunggu klaster Anda dibuat dengan Available status di halaman Clusters.

Langkah 2: Konfigurasikan aturan masuk untuk klien SQL

catatan

Kami menyarankan Anda melewati langkah ini dan mengakses klaster Anda menggunakan editor kueri Amazon Redshift v2.

Kemudian dalam tutorial ini, Anda mengakses cluster Anda dari dalam virtual private cloud (VPC) berdasarkan VPC layanan Amazon. Namun, jika Anda menggunakan SQL klien dari luar firewall untuk mengakses cluster, pastikan Anda memberikan akses masuk.

Untuk memeriksa firewall Anda dan memberikan akses masuk ke cluster Anda
  1. Periksa aturan firewall Anda jika klaster Anda perlu diakses dari luar firewall. Misalnya, klien Anda mungkin berupa instans Amazon Elastic Compute Cloud (AmazonEC2) atau komputer eksternal.

    Untuk informasi selengkapnya tentang aturan firewall, lihat Aturan grup keamanan di Panduan EC2 Pengguna Amazon.

  2. Untuk mengakses dari klien EC2 eksternal Amazon, tambahkan aturan masuk ke grup keamanan yang dilampirkan ke klaster Anda yang memungkinkan lalu lintas masuk. Anda menambahkan aturan grup EC2 keamanan Amazon di EC2 konsol Amazon. Misalnya, CIDR /IP 192.0.2.0/24 memungkinkan klien dalam rentang alamat IP tersebut untuk terhubung ke cluster Anda. Cari tahu CIDR /IP yang benar untuk lingkungan Anda.

Langkah 3: Berikan akses ke SQL klien dan jalankan kueri

Untuk menanyakan database yang dihosting oleh cluster Amazon Redshift Anda, Anda memiliki beberapa opsi SQL untuk klien. Ini termasuk:

  • Hubungkan ke klaster Anda dan jalankan kueri menggunakan editor kueri Amazon Redshift v2.

    Jika Anda menggunakan editor kueri v2, Anda tidak perlu mengunduh dan menyiapkan aplikasi SQL klien. Anda meluncurkan editor kueri Amazon Redshift v2 dari konsol Amazon Redshift.

  • Connect ke cluster Anda menggunakanRSQL. Untuk informasi selengkapnya, lihat Menghubungkan dengan Amazon Redshift RSQL di Panduan Manajemen Pergeseran Merah Amazon.

  • Connect ke klaster Anda melalui alat SQL klien, seperti SQL Workbench/J. Untuk informasi selengkapnya, lihat Connect ke cluster Anda menggunakan SQL Workbench/J di Amazon Redshift Management Guide.

Tutorial ini menggunakan editor kueri Amazon Redshift v2 sebagai cara mudah untuk menjalankan kueri pada database yang dihosting oleh cluster Amazon Redshift Anda. Setelah membuat cluster Anda, Anda dapat langsung menjalankan kueri. Untuk detail tentang pertimbangan saat menggunakan editor kueri Amazon Redshift v2, lihat Pertimbangan saat bekerja dengan editor kueri v2 di Panduan Manajemen Amazon Redshift.

Memberikan akses ke editor kueri v2

Pertama kali administrator mengonfigurasi editor kueri v2 untuk Anda Akun AWS, mereka memilih AWS KMS key yang digunakan untuk mengenkripsi sumber daya editor kueri v2. Sumber daya editor kueri Amazon Redshift v2 mencakup kueri, buku catatan, dan bagan yang disimpan. Secara default, kunci yang AWS dimiliki digunakan untuk mengenkripsi sumber daya. Atau, administrator dapat menggunakan kunci yang dikelola pelanggan dengan memilih Amazon Resource Name (ARN) untuk kunci di halaman konfigurasi. Setelah Anda mengonfigurasi akun, pengaturan AWS KMS enkripsi tidak dapat diubah. Untuk informasi selengkapnya, lihat Mengonfigurasi Anda Akun AWS di Panduan Manajemen Pergeseran Merah Amazon.

Untuk mengakses editor kueri v2, Anda memerlukan izin. Administrator dapat melampirkan salah satu kebijakan AWS terkelola untuk editor kueri Amazon Redshift v2 ke IAM peran atau pengguna untuk memberikan izin. Kebijakan AWS terkelola ini ditulis dengan opsi berbeda yang mengontrol bagaimana sumber daya penandaan memungkinkan berbagi kueri. Anda dapat menggunakan IAM console (https://console.aws.amazon.com/iam/) untuk melampirkan IAM kebijakan. Untuk informasi selengkapnya tentang kebijakan ini, lihat Mengakses editor kueri v2 di Panduan Manajemen Amazon Redshift.

Anda juga dapat membuat kebijakan sendiri berdasarkan izin yang diizinkan dan ditolak dalam kebijakan terkelola yang disediakan. Jika Anda menggunakan editor kebijakan IAM konsol untuk membuat kebijakan Anda sendiri, pilih SQLWorkbench sebagai layanan yang Anda buat kebijakan di editor visual. Editor kueri v2 menggunakan nama layanan AWS SQL Workbench di editor visual dan Simulator IAM Kebijakan.

Untuk informasi selengkapnya, lihat Bekerja dengan editor kueri v2 di Panduan Manajemen Amazon Redshift.

Langkah 4: Muat data dari Amazon S3 ke Amazon Redshift

Setelah membuat cluster, Anda dapat memuat data dari Amazon S3 ke tabel database Anda. Ada beberapa cara untuk memuat data dari Amazon S3.

  • Anda dapat menggunakan SQL klien untuk menjalankan SQL CREATE TABLE perintah untuk membuat tabel di database Anda dan kemudian menggunakan SQL COPY perintah untuk memuat data dari Amazon S3. Editor kueri Amazon Redshift v2 adalah SQL klien.

  • Anda dapat menggunakan wizard pemuatan Amazon Redshift query editor v2.

Tutorial ini menunjukkan cara menggunakan editor kueri Amazon Redshift v2 untuk SQL menjalankan perintah CREATE ke tabel COPY dan data. Luncurkan Query editor v2 dari panel navigasi konsol Amazon Redshift. Dalam query editor v2 buat koneksi ke examplecluster cluster dan database bernama dev dengan pengguna admin Andaawsuser. Untuk tutorial ini pilih Kredensi sementara menggunakan nama pengguna database saat Anda membuat koneksi. Untuk detail tentang menggunakan editor kueri Amazon Redshift v2, lihat Menyambungkan ke database Amazon Redshift di Panduan Manajemen Pergeseran Merah Amazon.

Memuat data dari Amazon S3 menggunakan perintah SQL

Pada panel editor kueri editor kueri v2, konfirmasikan bahwa Anda terhubung ke examplecluster cluster dan dev database. Selanjutnya, buat tabel dalam database dan muat data ke tabel. Untuk tutorial ini, data yang Anda muat tersedia di bucket Amazon S3 yang dapat diakses dari banyak orang. Wilayah AWS

Prosedur berikut membuat tabel dan memuat data dari bucket Amazon S3 publik.

Gunakan Amazon Redshift query editor v2 untuk menyalin dan menjalankan pernyataan create table berikut untuk membuat tabel dalam public skema database. dev Untuk informasi selengkapnya tentang sintaks, lihat CREATETABLEdi Panduan Pengembang Database Amazon Redshift.

Untuk membuat dan memuat data menggunakan SQL klien seperti editor kueri v2
  1. Jalankan SQL perintah berikut CREATE ke sales tabel.

    drop table if exists sales; create table sales( salesid integer not null, listid integer not null distkey, sellerid integer not null, buyerid integer not null, eventid integer not null, dateid smallint not null sortkey, qtysold smallint not null, pricepaid decimal(8,2), commission decimal(8,2), saletime timestamp);
  2. Jalankan SQL perintah berikut CREATE ke date tabel.

    drop table if exists date; create table date( dateid smallint not null distkey sortkey, caldate date not null, day character(3) not null, week smallint not null, month character(5) not null, qtr character(5) not null, year smallint not null, holiday boolean default('N'));
  3. Muat sales tabel dari Amazon S3 menggunakan perintah. COPY

    catatan

    Sebaiknya gunakan COPY perintah untuk memuat kumpulan data besar ke Amazon Redshift dari Amazon S3. Untuk informasi selengkapnya tentang COPY sintaks, lihat COPYdi Panduan Pengembang Database Amazon Redshift.

    Berikan autentikasi untuk klaster Anda untuk mengakses Amazon S3 atas nama Anda untuk memuat data sampel. Anda memberikan autentikasi dengan mereferensikan IAM peran yang Anda buat dan tetapkan sebagai klaster saat Anda memilih IAMperan Buat sebagai default saat membuat klaster. default

    Muat sales tabel menggunakan SQL perintah berikut. Anda secara opsional dapat mengunduh dan melihat dari Amazon S3 data sumber untuk sales tabel. .

    COPY sales FROM 's3://redshift-downloads/tickit/sales_tab.txt' DELIMITER '\t' TIMEFORMAT 'MM/DD/YYYY HH:MI:SS' REGION 'us-east-1' IAM_ROLE default;
  4. Muat date tabel menggunakan SQL perintah berikut. Anda secara opsional dapat mengunduh dan melihat dari Amazon S3 data sumber untuk date tabel. .

    COPY date FROM 's3://redshift-downloads/tickit/date2008_pipe.txt' DELIMITER '|' REGION 'us-east-1' IAM_ROLE default;

Memuat data dari Amazon S3 menggunakan editor kueri v2

Bagian ini menjelaskan pemuatan data Anda sendiri ke dalam klaster Amazon Redshift. Editor kueri v2 menyederhanakan pemuatan data saat menggunakan wizard Load data. COPYPerintah yang dihasilkan dan digunakan dalam editor kueri v2 Load data wizard mendukung banyak parameter yang tersedia untuk sintaks COPY perintah untuk memuat data dari Amazon S3. Untuk informasi tentang COPY perintah dan opsinya yang digunakan untuk menyalin beban dari Amazon S3, lihat dari COPYAmazon Simple Storage Service di Panduan Pengembang Database Amazon Redshift.

Untuk memuat data Anda sendiri dari Amazon S3 ke Amazon Redshift, Amazon Redshift memerlukan peran yang memiliki hak istimewa IAM yang diperlukan untuk memuat data dari bucket Amazon S3 yang ditentukan.

Untuk memuat data Anda sendiri dari Amazon S3 ke Amazon Redshift, Anda dapat menggunakan panduan memuat data editor kueri v2. Untuk informasi tentang cara menggunakan panduan memuat data, lihat Memuat data dari Amazon S3 di Panduan Manajemen Amazon Redshift.

Buat TICKIT data di klaster Anda

TICKITadalah database sampel yang dapat Anda muat secara opsional ke dalam klaster Amazon Redshift untuk tujuan mempelajari cara menanyakan data di Amazon Redshift. Anda dapat membuat set lengkap TICKIT tabel dan memuat data ke dalam klaster Anda dengan cara berikut:

  • Saat membuat cluster di konsol Amazon Redshift, Anda memiliki opsi untuk memuat TICKIT data sampel secara bersamaan. Di konsol Amazon Redshift, pilih Clusters, Create cluster. Di bagian Data sampel, pilih Muat data sampel Amazon Redshift memuat kumpulan data sampelnya ke dev database cluster Amazon Redshift Anda secara otomatis selama pembuatan klaster.

  • Untuk terhubung ke cluster yang ada, lakukan hal berikut:

    • Di konsol Amazon Redshift, pilih Cluster dari bilah navigasi.

    • Pilih klaster Anda dari panel Clusters.

    • Pilih Data kueri, Kueri di editor kueri v2.

    • Perluas examplecluster dalam daftar sumber daya. Jika ini adalah pertama kalinya Anda terhubung ke cluster Anda, Connect to examplecluster akan muncul. Pilih nama pengguna dan kata sandi Database. Biarkan database sebagaidev. Tentukan awsuser nama pengguna dan Changeit1 kata sandi.

    • Pilih Buat koneksi.

  • Dengan editor kueri Amazon Redshift v2, Anda dapat memuat TICKIT data ke dalam database sampel bernama sample_data_dev. Pilih database sample_data_dev dalam daftar sumber daya. Di sebelah simpul tickit, pilih ikon Buka contoh buku catatan. Konfirmasikan bahwa Anda ingin membuat database sampel.

  • Editor kueri Amazon Redshift v2 membuat database sampel bersama dengan contoh notebook bernama. tickit-sample-notebook Anda dapat memilih Jalankan semua untuk menjalankan buku catatan ini untuk menanyakan data dalam database sampel.

Untuk melihat detail tentang TICKIT data, lihat Contoh database di Panduan Pengembang Database Amazon Redshift.

Langkah 5: Coba contoh kueri menggunakan editor kueri

Untuk menyiapkan dan menggunakan editor kueri Amazon Redshift v2 untuk membuat kueri database, lihat Bekerja dengan editor kueri v2 di Panduan Manajemen Amazon Redshift.

Sekarang, coba beberapa contoh query, seperti yang ditunjukkan berikut. Untuk membuat kueri baru di editor kueri v2, pilih ikon+di kanan atas panel kueri, dan pilih. SQL Halaman kueri baru muncul di mana Anda dapat menyalin dan menempelkan SQL kueri berikut.

catatan

Pastikan untuk menjalankan kueri pertama di notebook terlebih dahulu, yang menetapkan nilai konfigurasi search_path server ke tickit skema menggunakan SQL perintah berikut:

set search_path to tickit;

Untuk informasi selengkapnya tentang bekerja dengan SELECT perintah, lihat SELECTdi Panduan Pengembang Database Amazon Redshift.

-- Get definition for the sales table. SELECT * FROM pg_table_def WHERE tablename = 'sales';
-- Find total sales on a given calendar date. SELECT sum(qtysold) FROM sales, date WHERE sales.dateid = date.dateid AND caldate = '2008-01-05';
-- Find top 10 buyers by quantity. SELECT firstname, lastname, total_quantity FROM (SELECT buyerid, sum(qtysold) total_quantity FROM sales GROUP BY buyerid ORDER BY total_quantity desc limit 10) Q, users WHERE Q.buyerid = userid ORDER BY Q.total_quantity desc;
-- Find events in the 99.9 percentile in terms of all time gross sales. SELECT eventname, total_price FROM (SELECT eventid, total_price, ntile(1000) over(order by total_price desc) as percentile FROM (SELECT eventid, sum(pricepaid) total_price FROM sales GROUP BY eventid)) Q, event E WHERE Q.eventid = E.eventid AND percentile = 1 ORDER BY total_price desc;

Langkah 6: Setel ulang lingkungan Anda

Pada langkah sebelumnya, Anda telah berhasil membuat klaster Amazon Redshift, memuat data ke dalam tabel, dan data kueri menggunakan SQL klien seperti editor kueri Amazon Redshift v2.

Ketika Anda telah menyelesaikan tutorial ini, kami sarankan Anda mengatur ulang lingkungan Anda ke keadaan sebelumnya dengan menghapus cluster sampel Anda. Anda terus dikenakan biaya untuk layanan Amazon Redshift hingga Anda menghapus klaster.

Namun, Anda mungkin ingin menjaga cluster sampel tetap berjalan jika Anda ingin mencoba tugas di panduan Amazon Redshift lainnya atau tugas yang dijelaskan. Jalankan perintah untuk mendefinisikan dan menggunakan database di gudang data Anda

Untuk menghapus klaster
  1. Masuk ke AWS Management Console dan buka konsol Amazon Redshift di. https://console.aws.amazon.com/redshiftv2/

  2. Pada menu navigasi, pilih Cluster untuk menampilkan daftar cluster Anda.

  3. Pilih examplecluster cluster. Untuk Tindakan, pilih Hapus. Examplecluster Hapus? halaman muncul.

  4. Konfirmasikan cluster yang akan dihapus, hapus centang pada pengaturan Buat snapshot akhir, lalu masukkan delete untuk mengonfirmasi penghapusan. Pilih Hapus klaster.

Pada halaman daftar cluster, status cluster diperbarui saat cluster dihapus.

Setelah Anda menyelesaikan tutorial ini, Anda dapat menemukan informasi lebih lanjut tentang Amazon Redshift dan langkah selanjutnya. Sumber daya tambahan untuk mempelajari tentang Amazon Redshift