Memulai gudang data yang disediakan Amazon Redshift

Mode fokus

Memulai gudang data yang disediakan Amazon Redshift - Amazon Redshift

Mendaftar untuk AWS Tentukan aturan firewall Langkah 1: Buat cluster sampel Langkah 2: Konfigurasikan aturan masuk untuk klien SQL Langkah 3: Berikan akses ke klien SQL dan jalankan kueri Langkah 4: Muat data dari Amazon S3 ke Amazon Redshift Langkah 5: Coba contoh kueri menggunakan editor kueri Langkah 6: Setel ulang lingkungan Anda

Jika Anda adalah pengguna pertama kali Amazon Redshift, kami sarankan Anda membaca bagian berikut untuk membantu Anda mulai menggunakan kluster yang disediakan. Alur dasar Amazon Redshift adalah membuat sumber daya yang disediakan, terhubung ke Amazon Redshift, memuat data sampel, dan kemudian menjalankan kueri pada data. Dalam panduan ini, Anda dapat memilih untuk memuat data sampel dari Amazon Redshift atau dari bucket Amazon S3. Data sampel digunakan di seluruh dokumentasi Amazon Redshift untuk mendemonstrasikan fitur.

Tutorial ini menunjukkan cara menggunakan kluster yang disediakan Amazon Redshift, yang merupakan objek gudang data tempat AWS Anda mengelola sumber daya sistem. Anda juga dapat menggunakan Amazon Redshift dengan grup kerja tanpa server, yang merupakan objek gudang data yang diskalakan secara otomatis sebagai respons terhadap penggunaan. Untuk mulai menggunakan Redshift Serverless, lihat. Memulai dengan gudang data Amazon Redshift Tanpa Server

Setelah membuat dan masuk ke konsol yang disediakan Amazon Redshift, Anda dapat membuat dan mengelola objek Amazon Redshift, termasuk cluster, node, dan database. Anda juga dapat menjalankan kueri, melihat kueri, dan melakukan operasi SQL data definition language (DDL) dan data manipulation language (DHTML) lainnya dengan klien SQL.

penting

Cluster yang Anda sediakan untuk latihan ini berjalan di lingkungan hidup. Selama itu berjalan, itu menimbulkan biaya untuk Anda. Akun AWS Untuk informasi harga, lihat halaman harga Amazon Redshift.

Untuk menghindari biaya yang tidak perlu, hapus klaster Anda setelah selesai melakukannya. Bagian terakhir dari pasal ini menjelaskan bagaimana melakukannya.

Masuk ke AWS Management Console dan buka konsol Amazon Redshift di. https://console.aws.amazon.com/redshiftv2/

Kami menyarankan Anda memulai dengan membuka dasbor cluster yang disediakan untuk mulai menggunakan konsol Amazon Redshift.

Bergantung pada konfigurasi Anda, item berikut akan muncul di panel navigasi konsol yang disediakan Amazon Redshift:

Redshift Tanpa Server — Akses dan analisis data tanpa perlu menyiapkan, menyetel, dan mengelola klaster yang disediakan Amazon Redshift.
Dasbor kluster yang disediakan — Lihat daftar cluster di Anda Wilayah AWS, periksa metrik Cluster, dan ikhtisar kueri untuk wawasan data metrik (seperti pemanfaatan CPU) dan informasi kueri. Menggunakan ini dapat membantu Anda menentukan apakah data kinerja Anda tidak normal selama rentang waktu tertentu.
Cluster — Lihat daftar cluster Anda dalam hal ini Wilayah AWS, pilih klaster untuk memulai kueri, atau melakukan tindakan terkait cluster. Anda juga dapat membuat cluster baru dari halaman ini.
Editor kueri — Jalankan kueri pada database yang dihosting di klaster Amazon Redshift Anda. Kami merekomendasikan menggunakan Query editor v2 sebagai gantinya.
Editor kueri v2 - Editor kueri Amazon Redshift v2 adalah aplikasi klien SQL berbasis web terpisah untuk membuat dan menjalankan kueri di gudang data Amazon Redshift Anda. Anda dapat memvisualisasikan hasil Anda dalam bagan dan berkolaborasi dengan membagikan pertanyaan Anda dengan orang lain di tim Anda.
Kueri dan beban — Dapatkan informasi untuk referensi atau pemecahan masalah, seperti daftar kueri terbaru dan teks SQL untuk setiap kueri.
Datashares — Sebagai administrator akun produsen, otorisasi akun konsumen untuk mengakses datashares atau memilih untuk tidak mengotorisasi akses. Untuk menggunakan datashare resmi, administrator akun konsumen dapat mengaitkan datashare dengan seluruh Akun AWS atau ruang nama klaster tertentu dalam akun. Administrator juga dapat menolak datashare.
Integrasi nol-ETL — Kelola integrasi yang membuat data transaksional tersedia di Amazon Redshift setelah ditulis dalam sumber yang didukung.
Koneksi IAM Identity Center — Konfigurasikan koneksi antara Amazon Redshift dan IAM Identity Center.
Konfigurasi - Hubungkan ke cluster Amazon Redshift dari alat klien SQL melalui koneksi Java Database Connectivity (JDBC) dan Open Database Connectivity (ODBC). Anda juga dapat menyiapkan titik akhir cloud pribadi virtual (VPC) yang dikelola Amazon Redshift. Melakukan hal itu menyediakan koneksi pribadi antara VPC berdasarkan layanan Amazon VPC yang berisi cluster dan VPC lain yang menjalankan alat klien.
AWS Integrasi Mitra - Buat integrasi dengan AWS Mitra yang didukung.
Penasihat — Dapatkan rekomendasi spesifik tentang perubahan yang dapat Anda lakukan pada klaster Amazon Redshift untuk memprioritaskan pengoptimalan Anda.
AWS Marketplace — Dapatkan informasi tentang alat atau AWS layanan lain yang berfungsi dengan Amazon Redshift.
Alarm — Buat alarm pada metrik klaster untuk melihat data kinerja dan melacak metrik selama periode waktu yang Anda tentukan.
Acara — Lacak peristiwa dan dapatkan laporan tentang informasi seperti tanggal peristiwa terjadi, deskripsi, atau sumber acara.
Apa yang baru - Lihat fitur Amazon Redshift baru dan pembaruan produk.

Dalam tutorial ini, Anda melakukan langkah-langkah berikut.

Langkah-langkah dalam tutorial ini, diuraikan berikut

Topik

Mendaftar untuk AWS
Tentukan aturan firewall
Langkah 1: Buat contoh cluster Amazon Redshift
Langkah 2: Konfigurasikan aturan masuk untuk klien SQL
Langkah 3: Berikan akses ke klien SQL dan jalankan kueri
Langkah 4: Muat data dari Amazon S3 ke Amazon Redshift
Langkah 5: Coba contoh kueri menggunakan editor kueri
Langkah 6: Setel ulang lingkungan Anda

Jika Anda belum memilikinya Akun AWS, daftarlah untuk satu. Jika Anda sudah memiliki akun, Anda dapat melewati prasyarat ini dan menggunakan akun yang ada.

Buka https://portal.aws.amazon.com/billing/pendaftaran.
Ikuti petunjuk online.

Bagian dari prosedur pendaftaran melibatkan tindakan menerima panggilan telepon dan memasukkan kode verifikasi di keypad telepon.

Saat Anda mendaftar untuk sebuah Akun AWS, sebuah Pengguna root akun AWSdibuat. Pengguna root memiliki akses ke semua Layanan AWS dan sumber daya di akun. Sebagai praktik keamanan terbaik, tetapkan akses administratif ke pengguna, dan gunakan hanya pengguna root untuk melakukan tugas yang memerlukan akses pengguna root.

Tentukan aturan firewall

catatan

Tutorial ini mengasumsikan cluster Anda menggunakan port default 5439 dan Amazon Redshift query editor v2 dapat digunakan untuk menjalankan perintah SQL. Itu tidak masuk ke rincian tentang konfigurasi jaringan atau menyiapkan klien SQL yang mungkin diperlukan di lingkungan Anda.

Di beberapa lingkungan, Anda menentukan port saat meluncurkan klaster Amazon Redshift. Anda menggunakan port ini bersama dengan URL endpoint cluster untuk mengakses cluster. Anda juga membuat aturan masuk masuk dalam grup keamanan untuk mengizinkan akses melalui port ke klaster Anda.

Jika komputer klien Anda berada di belakang firewall, pastikan Anda mengetahui port terbuka yang dapat Anda gunakan. Menggunakan port terbuka ini, Anda dapat terhubung ke cluster dari alat klien SQL dan menjalankan kueri. Jika Anda tidak tahu port terbuka, bekerja dengan seseorang yang memahami aturan firewall jaringan Anda untuk menentukan port terbuka di firewall Anda.

Meskipun Amazon Redshift menggunakan port 5439 secara default, koneksi tidak berfungsi jika port itu tidak terbuka di firewall Anda. Anda tidak dapat mengubah nomor port untuk klaster Amazon Redshift setelah dibuat. Jadi, pastikan Anda menentukan port terbuka yang berfungsi di lingkungan Anda selama proses peluncuran.

Langkah 1: Buat contoh cluster Amazon Redshift

Dalam tutorial ini, Anda berjalan melalui proses untuk membuat cluster Amazon Redshift dengan database. Kemudian Anda memuat kumpulan data dari Amazon S3 ke tabel di database Anda. Anda dapat menggunakan contoh cluster ini untuk mengevaluasi layanan Amazon Redshift.

Sebelum Anda mulai menyiapkan cluster Amazon Redshift, pastikan Anda menyelesaikan prasyarat yang diperlukan seperti dan. Mendaftar untuk AWS Tentukan aturan firewall

Untuk setiap operasi yang mengakses data dari AWS sumber daya lain, klaster Anda memerlukan izin untuk mengakses sumber daya dan data pada sumber daya atas nama Anda. Contohnya adalah menggunakan perintah SQL COPY untuk memuat data dari Amazon Simple Storage Service (Amazon S3). Anda memberikan izin tersebut dengan menggunakan AWS Identity and Access Management (IAM). Anda dapat melakukan ini melalui peran IAM yang Anda buat dan lampirkan ke cluster Anda. Untuk informasi selengkapnya tentang kredensil dan izin akses, lihat Kredensial dan izin akses di Panduan Pengembang Database Amazon Redshift.

Untuk membuat cluster Amazon Redshift

Masuk ke AWS Management Console dan buka konsol Amazon Redshift di. https://console.aws.amazon.com/redshiftv2/

penting
Jika Anda menggunakan kredensil pengguna IAM, pastikan Anda memiliki izin yang diperlukan untuk melakukan operasi klaster. Untuk informasi selengkapnya, lihat Keamanan di Amazon Redshift di Panduan Manajemen Pergeseran Merah Amazon.
Di AWS konsol, pilih Wilayah AWS tempat Anda ingin membuat cluster.
Pada menu navigasi, pilih Clusters, lalu pilih Create cluster. Halaman Create cluster muncul.
Di bagian Konfigurasi cluster, tentukan nilai untuk pengidentifikasi Cluster, tipe Node, dan Node:
- Cluster identifier: Masukkan examplecluster untuk tutorial ini. Pengenal ini harus unik. Pengenal harus dari 1-63 karakter menggunakan karakter yang valid a—z (hanya huruf kecil) dan - (tanda hubung).
- Pilih salah satu metode berikut untuk mengukur cluster Anda:
  
  catatan
  Langkah berikut mengasumsikan Wilayah AWS yang mendukung tipe RA3 node. Untuk daftar jenis RA3 node pendukung Wilayah AWS tersebut, lihat Ringkasan jenis RA3 node di Panduan Manajemen Amazon Redshift. Untuk mempelajari lebih lanjut tentang spesifikasi node untuk setiap jenis dan ukuran node, lihat Detail tipe Node.
  - Jika Anda tidak tahu seberapa besar ukuran cluster Anda, pilih Bantu saya pilih. Melakukan hal itu membuka kalkulator ukuran yang menanyakan pertanyaan tentang ukuran dan karakteristik kueri data yang Anda rencanakan untuk disimpan di gudang data Anda.
    
    Jika Anda mengetahui ukuran cluster Anda yang diperlukan (yaitu, jenis node dan jumlah node), pilih yang akan saya pilih. Kemudian pilih jenis Node dan jumlah Node untuk mengukur cluster Anda.
    
    Untuk tutorial ini, pilih ra3.4xlarge untuk tipe Node dan 2 untuk Jumlah node.
    
    Jika pilihan untuk konfigurasi AZ tersedia, pilih Single-AZ.
  - Untuk menggunakan kumpulan data sampel yang disediakan Amazon Redshift, dalam Data sampel, pilih Muat data sampel. Amazon Redshift memuat kumpulan data sampel Tickit ke database dan skema defaultdev. public
Di bagian konfigurasi Database, tentukan nilai untuk nama pengguna Admin. Untuk kata sandi Admin, pilih dari opsi berikut:
- Buat kata sandi — Gunakan kata sandi yang dihasilkan oleh Amazon Redshift.
- Tambahkan kata sandi admin secara manual — Gunakan kata sandi Anda sendiri.
- Kelola kredensi admin di AWS Secrets Manager — Amazon Redshift AWS Secrets Manager menggunakan untuk membuat dan mengelola kata sandi admin Anda. Menggunakan AWS Secrets Manager untuk menghasilkan dan mengelola rahasia kata sandi Anda menimbulkan biaya. Untuk informasi tentang AWS Secrets Manager harga, lihat AWS Secrets Manager Harga.
Untuk tutorial ini, gunakan nilai-nilai ini:
- Nama pengguna admin: Enterawsuser.
- Kata sandi pengguna admin: Masukkan Changeit1 kata sandi.
Untuk tutorial ini, buat peran IAM dan atur sebagai default untuk cluster Anda, seperti yang dijelaskan berikut. Hanya ada satu set peran IAM default untuk sebuah cluster.
1. Di bawah Izin klaster, untuk Kelola peran IAM, pilih Buat peran IAM.
2. Tentukan bucket Amazon S3 agar peran IAM dapat diakses dengan salah satu metode berikut:
  - Pilih Tidak ada bucket Amazon S3 tambahan untuk mengizinkan peran IAM yang dibuat hanya mengakses bucket Amazon S3 yang diberi nama. redshift
  - Pilih bucket Amazon S3 apa pun untuk memungkinkan peran IAM yang dibuat mengakses semua bucket Amazon S3.
  - Pilih Bucket Amazon S3 Spesifik untuk menentukan satu atau beberapa bucket Amazon S3 untuk peran IAM yang dibuat untuk diakses. Kemudian pilih satu atau lebih ember Amazon S3 dari tabel.
3. Pilih Buat peran IAM sebagai default. Amazon Redshift secara otomatis membuat dan menetapkan peran IAM sebagai default untuk klaster Anda.
  
  Karena Anda membuat peran IAM Anda dari konsol, itu memiliki AmazonRedshiftAllCommandsFullAccess kebijakan yang dilampirkan. Ini memungkinkan Amazon Redshift untuk menyalin, memuat, menanyakan, dan menganalisis data dari sumber daya Amazon di akun IAM Anda.
Untuk informasi tentang cara mengelola peran IAM default untuk klaster, lihat Membuat peran IAM sebagai default untuk Amazon Redshift di Panduan Manajemen Pergeseran Merah Amazon.
(Opsional) Di bagian Konfigurasi tambahan, matikan Gunakan default untuk mengubah pengaturan Jaringan dan keamanan, konfigurasi Database, Pemeliharaan, Pemantauan, dan Pencadangan.

Dalam beberapa kasus, Anda dapat membuat klaster dengan opsi Muat data sampel dan ingin mengaktifkan perutean Amazon VPC yang disempurnakan. Jika demikian, cluster di virtual private cloud (VPC) Anda memerlukan akses ke endpoint Amazon S3 agar data dapat dimuat.

Untuk membuat cluster dapat diakses publik, Anda dapat melakukan salah satu dari dua hal. Anda dapat mengonfigurasi alamat terjemahan alamat jaringan (NAT) di VPC Anda agar cluster dapat mengakses internet. Atau Anda dapat mengonfigurasi titik akhir VPC Amazon S3 di VPC Anda. Untuk informasi selengkapnya tentang perutean VPC Amazon yang disempurnakan, lihat Perutean VPC Amazon yang disempurnakan di Panduan Manajemen Pergeseran Merah Amazon.
Pilih Buat klaster. Tunggu klaster Anda dibuat dengan Available status di halaman Clusters.

Langkah 2: Konfigurasikan aturan masuk untuk klien SQL

catatan

Kami menyarankan Anda melewati langkah ini dan mengakses klaster Anda menggunakan editor kueri Amazon Redshift v2.

Kemudian dalam tutorial ini, Anda mengakses cluster Anda dari dalam virtual private cloud (VPC) berdasarkan layanan Amazon VPC. Namun, jika Anda menggunakan klien SQL dari luar firewall Anda untuk mengakses cluster, pastikan Anda memberikan akses masuk.

Untuk memeriksa firewall Anda dan memberikan akses masuk ke cluster Anda

Periksa aturan firewall Anda jika klaster Anda perlu diakses dari luar firewall. Misalnya, klien Anda mungkin berupa instans Amazon Elastic Compute Cloud (Amazon EC2) atau komputer eksternal.

Untuk informasi selengkapnya tentang aturan firewall, lihat Aturan grup keamanan di Panduan EC2 Pengguna Amazon.
Untuk mengakses dari klien EC2 eksternal Amazon, tambahkan aturan masuk ke grup keamanan yang dilampirkan ke klaster Anda yang memungkinkan lalu lintas masuk. Anda menambahkan aturan grup EC2 keamanan Amazon di EC2 konsol Amazon. Misalnya, a CIDR/IP of 192.0.2.0/24 allows clients in that IP address range to connect to your cluster. Find out the correct CIDR/IP untuk lingkungan Anda.

Langkah 3: Berikan akses ke klien SQL dan jalankan kueri

Untuk menanyakan database yang dihosting oleh cluster Amazon Redshift Anda, Anda memiliki beberapa opsi untuk klien SQL. Ini termasuk:

Hubungkan ke klaster Anda dan jalankan kueri menggunakan editor kueri Amazon Redshift v2.

Jika Anda menggunakan editor kueri v2, Anda tidak perlu mengunduh dan menyiapkan aplikasi klien SQL. Anda meluncurkan editor kueri Amazon Redshift v2 dari konsol Amazon Redshift.
Connect ke cluster Anda menggunakan RSQL. Untuk informasi selengkapnya, lihat Menghubungkan dengan Amazon Redshift RSQL di Panduan Manajemen Amazon Redshift.
Connect ke cluster Anda melalui alat klien SQL, seperti SQL Workbench/J. Untuk informasi selengkapnya, lihat Connect to your cluster menggunakan SQL Workbench/J di Amazon Redshift Management Guide.

Tutorial ini menggunakan editor kueri Amazon Redshift v2 sebagai cara mudah untuk menjalankan kueri pada database yang dihosting oleh cluster Amazon Redshift Anda. Setelah membuat cluster Anda, Anda dapat langsung menjalankan kueri. Untuk detail tentang pertimbangan saat menggunakan editor kueri Amazon Redshift v2, lihat Pertimbangan saat bekerja dengan editor kueri v2 di Panduan Manajemen Amazon Redshift.

Memberikan akses ke editor kueri v2

Pertama kali administrator mengonfigurasi editor kueri v2 untuk Anda Akun AWS, mereka memilih AWS KMS key yang digunakan untuk mengenkripsi sumber daya editor kueri v2. Sumber daya editor kueri Amazon Redshift v2 mencakup kueri, buku catatan, dan bagan yang disimpan. Secara default, kunci yang AWS dimiliki digunakan untuk mengenkripsi sumber daya. Atau, administrator dapat menggunakan kunci yang dikelola pelanggan dengan memilih Amazon Resource Name (ARN) untuk kunci di halaman konfigurasi. Setelah Anda mengonfigurasi akun, pengaturan AWS KMS enkripsi tidak dapat diubah. Untuk informasi selengkapnya, lihat Mengonfigurasi Anda Akun AWS di Panduan Manajemen Pergeseran Merah Amazon.

Untuk mengakses editor kueri v2, Anda memerlukan izin. Administrator dapat melampirkan salah satu kebijakan AWS terkelola untuk editor kueri Amazon Redshift v2 ke peran IAM atau pengguna untuk memberikan izin. Kebijakan AWS terkelola ini ditulis dengan opsi berbeda yang mengontrol bagaimana sumber daya penandaan memungkinkan berbagi kueri. Anda dapat menggunakan konsol IAM (https://console.aws.amazon.com/iam/) untuk melampirkan kebijakan IAM. Untuk informasi selengkapnya tentang kebijakan ini, lihat Mengakses editor kueri v2 di Panduan Manajemen Amazon Redshift.

Anda juga dapat membuat kebijakan sendiri berdasarkan izin yang diizinkan dan ditolak dalam kebijakan terkelola yang disediakan. Jika Anda menggunakan editor kebijakan konsol IAM untuk membuat kebijakan Anda sendiri, pilih SQL Workbench sebagai layanan yang Anda buat kebijakan di editor visual. Query editor v2 menggunakan nama layanan AWS SQL Workbench di editor visual dan IAM Policy Simulator.

Untuk informasi selengkapnya, lihat Bekerja dengan editor kueri v2 di Panduan Manajemen Amazon Redshift.

Langkah 4: Muat data dari Amazon S3 ke Amazon Redshift

Setelah membuat cluster, Anda dapat memuat data dari Amazon S3 ke tabel database Anda. Ada beberapa cara untuk memuat data dari Amazon S3.

Anda dapat menggunakan klien SQL untuk menjalankan perintah SQL CREATE TABLE untuk membuat tabel di database Anda dan kemudian menggunakan perintah SQL COPY untuk memuat data dari Amazon S3. Editor kueri Amazon Redshift v2 adalah klien SQL.
Anda dapat menggunakan wizard pemuatan Amazon Redshift query editor v2.

Tutorial ini menunjukkan cara menggunakan Amazon Redshift query editor v2 untuk menjalankan perintah SQL untuk CREATE tabel dan COPY data. Luncurkan Query editor v2 dari panel navigasi konsol Amazon Redshift. Dalam query editor v2 buat koneksi ke examplecluster cluster dan database bernama dev dengan pengguna admin Andaawsuser. Untuk tutorial ini pilih Kredensi sementara menggunakan nama pengguna database saat Anda membuat koneksi. Untuk detail tentang menggunakan editor kueri Amazon Redshift v2, lihat Menyambungkan ke database Amazon Redshift di Panduan Manajemen Pergeseran Merah Amazon.

Memuat data dari Amazon S3 menggunakan perintah SQL

Pada panel editor kueri editor kueri v2, konfirmasikan bahwa Anda terhubung ke examplecluster cluster dan dev database. Selanjutnya, buat tabel dalam database dan muat data ke tabel. Untuk tutorial ini, data yang Anda muat tersedia di bucket Amazon S3 yang dapat diakses dari banyak orang. Wilayah AWS

Prosedur berikut membuat tabel dan memuat data dari bucket Amazon S3 publik.

Gunakan Amazon Redshift query editor v2 untuk menyalin dan menjalankan pernyataan create table berikut untuk membuat tabel dalam public skema database. dev Untuk informasi selengkapnya tentang sintaks, lihat MEMBUAT TABEL di Panduan Pengembang Database Amazon Redshift.

Untuk membuat dan memuat data menggunakan klien SQL seperti editor kueri v2

Jalankan perintah SQL berikut untuk CREATE sales tabel.



   drop table if exists sales;
   create table sales(
	salesid integer not null,
	listid integer not null distkey,
	sellerid integer not null,
	buyerid integer not null,
	eventid integer not null,
	dateid smallint not null sortkey,
	qtysold smallint not null,
	pricepaid decimal(8,2),
	commission decimal(8,2),
	saletime timestamp);

Jalankan perintah SQL berikut untuk CREATE date tabel.



drop table if exists date;              
create table date(
	dateid smallint not null distkey sortkey,
	caldate date not null,
	day character(3) not null,
	week smallint not null,
	month character(5) not null,
	qtr character(5) not null,
	year smallint not null,
	holiday boolean default('N'));

Muat sales tabel dari Amazon S3 menggunakan perintah COPY.

catatan
Sebaiknya gunakan perintah COPY untuk memuat kumpulan data besar ke Amazon Redshift dari Amazon S3. Untuk informasi selengkapnya tentang sintaks COPY, lihat COPY di Panduan Pengembang Database Amazon Redshift.

Berikan autentikasi untuk klaster Anda untuk mengakses Amazon S3 atas nama Anda untuk memuat data sampel. Anda memberikan autentikasi dengan mereferensikan peran IAM yang Anda buat dan tetapkan sebagai klaster saat Anda memilih Create IAM role sebagai default saat Anda membuat klaster. default

Muat sales tabel menggunakan perintah SQL berikut. Anda secara opsional dapat mengunduh dan melihat dari Amazon S3 data sumber untuk sales tabel. .
```
COPY sales
    FROM 's3://redshift-downloads/tickit/sales_tab.txt' 
    DELIMITER '\t' 
    TIMEFORMAT 'MM/DD/YYYY HH:MI:SS' 
    REGION 'us-east-1'
    IAM_ROLE default;
```

Muat date tabel menggunakan perintah SQL berikut. Anda secara opsional dapat mengunduh dan melihat dari Amazon S3 data sumber untuk date tabel. .


COPY date
    FROM 's3://redshift-downloads/tickit/date2008_pipe.txt' 
    DELIMITER '|' 
    REGION 'us-east-1'
    IAM_ROLE default;

Memuat data dari Amazon S3 menggunakan editor kueri v2

Bagian ini menjelaskan pemuatan data Anda sendiri ke dalam klaster Amazon Redshift. Editor kueri v2 menyederhanakan pemuatan data saat menggunakan wizard Load data. Perintah COPY yang dihasilkan dan digunakan dalam editor kueri v2 Load data wizard mendukung banyak parameter yang tersedia untuk sintaks perintah COPY untuk memuat data dari Amazon S3. Untuk informasi tentang perintah COPY dan opsinya yang digunakan untuk menyalin beban dari Amazon S3, lihat COPY dari Amazon Simple Storage Service di Panduan Pengembang Database Amazon Redshift.

Untuk memuat data Anda sendiri dari Amazon S3 ke Amazon Redshift, Amazon Redshift memerlukan peran IAM yang memiliki hak istimewa yang diperlukan untuk memuat data dari bucket Amazon S3 yang ditentukan.

Untuk memuat data Anda sendiri dari Amazon S3 ke Amazon Redshift, Anda dapat menggunakan panduan memuat data editor kueri v2. Untuk informasi tentang cara menggunakan panduan memuat data, lihat Memuat data dari Amazon S3 di Panduan Manajemen Amazon Redshift.

Buat data TICKIT di klaster Anda

TICKIT adalah database sampel yang dapat Anda muat secara opsional ke dalam klaster Amazon Redshift Anda untuk tujuan mempelajari cara menanyakan data di Amazon Redshift. Anda dapat membuat set lengkap tabel TICKIT dan memuat data ke dalam klaster Anda dengan cara berikut:

Saat membuat cluster di konsol Amazon Redshift, Anda memiliki opsi untuk memuat data TICKIT sampel secara bersamaan. Di konsol Amazon Redshift, pilih Clusters, Create cluster. Di bagian Data sampel, pilih Muat data sampel Amazon Redshift memuat kumpulan data sampelnya ke dev database cluster Amazon Redshift Anda secara otomatis selama pembuatan klaster.
Untuk terhubung ke cluster yang ada, lakukan hal berikut:
- Di konsol Amazon Redshift, pilih Cluster dari bilah navigasi.
- Pilih klaster Anda dari panel Clusters.
- Pilih Data kueri, Kueri di editor kueri v2.
- Perluas examplecluster dalam daftar sumber daya. Jika ini adalah pertama kalinya Anda terhubung ke cluster Anda, Connect to examplecluster akan muncul. Pilih nama pengguna dan kata sandi Database. Biarkan database sebagaidev. Tentukan awsuser nama pengguna dan Changeit1 kata sandi.
- Pilih Buat koneksi.
Dengan editor kueri Amazon Redshift v2, Anda dapat memuat data TICKIT ke dalam database sampel bernama sample_data_dev. Pilih database sample_data_dev dalam daftar sumber daya. Di sebelah simpul tickit, pilih ikon Buka contoh buku catatan. Konfirmasikan bahwa Anda ingin membuat database sampel.
Editor kueri Amazon Redshift v2 membuat database sampel bersama dengan contoh notebook bernama. tickit-sample-notebook Anda dapat memilih Jalankan semua untuk menjalankan buku catatan ini untuk menanyakan data dalam database sampel.

Untuk melihat detail tentang data TICKIT, lihat Contoh database di Panduan Pengembang Database Amazon Redshift.

Langkah 5: Coba contoh kueri menggunakan editor kueri

Untuk menyiapkan dan menggunakan editor kueri Amazon Redshift v2 untuk membuat kueri database, lihat Bekerja dengan editor kueri v2 di Panduan Manajemen Amazon Redshift.

Sekarang, coba beberapa contoh query, seperti yang ditunjukkan berikut. Untuk membuat kueri baru di editor kueri v2, pilih ikon+di kanan atas panel kueri, dan pilih SQL. Halaman kueri baru muncul di mana Anda dapat menyalin dan menempelkan kueri SQL berikut.

catatan

Pastikan untuk menjalankan kueri pertama di notebook terlebih dahulu, yang menetapkan nilai konfigurasi search_path server ke tickit skema menggunakan perintah SQL berikut:


set search_path to tickit;

Untuk informasi selengkapnya tentang bekerja dengan perintah SELECT, lihat SELECT di Panduan Pengembang Database Amazon Redshift.


-- Get definition for the sales table.
SELECT *    
FROM pg_table_def    
WHERE tablename = 'sales';


-- Find total sales on a given calendar date.
SELECT sum(qtysold) 
FROM   sales, date 
WHERE  sales.dateid = date.dateid 
AND    caldate = '2008-01-05';


-- Find top 10 buyers by quantity.
SELECT firstname, lastname, total_quantity 
FROM   (SELECT buyerid, sum(qtysold) total_quantity
        FROM  sales
        GROUP BY buyerid
        ORDER BY total_quantity desc limit 10) Q, users
WHERE Q.buyerid = userid
ORDER BY Q.total_quantity desc;


-- Find events in the 99.9 percentile in terms of all time gross sales.
SELECT eventname, total_price 
FROM  (SELECT eventid, total_price, ntile(1000) over(order by total_price desc) as percentile 
       FROM (SELECT eventid, sum(pricepaid) total_price
             FROM   sales
             GROUP BY eventid)) Q, event E
       WHERE Q.eventid = E.eventid
       AND percentile = 1
ORDER BY total_price desc;

Langkah 6: Setel ulang lingkungan Anda

Pada langkah sebelumnya, Anda telah berhasil membuat klaster Amazon Redshift, memuat data ke dalam tabel, dan data kueri menggunakan klien SQL seperti editor kueri Amazon Redshift v2.

Ketika Anda telah menyelesaikan tutorial ini, kami sarankan Anda mengatur ulang lingkungan Anda ke keadaan sebelumnya dengan menghapus cluster sampel Anda. Anda terus dikenakan biaya untuk layanan Amazon Redshift hingga Anda menghapus klaster.

Namun, Anda mungkin ingin menjaga cluster sampel tetap berjalan jika Anda ingin mencoba tugas di panduan Amazon Redshift lainnya atau tugas yang dijelaskan di dalamnya. Jalankan perintah untuk mendefinisikan dan menggunakan database di gudang data Anda

Untuk menghapus klaster

Masuk ke AWS Management Console dan buka konsol Amazon Redshift di. https://console.aws.amazon.com/redshiftv2/
Pada menu navigasi, pilih Cluster untuk menampilkan daftar cluster Anda.
Pilih examplecluster cluster. Untuk Tindakan, pilih Hapus. Examplecluster Hapus? halaman muncul.
Konfirmasikan cluster yang akan dihapus, hapus centang pada pengaturan Buat snapshot akhir, lalu masukkan delete untuk mengonfirmasi penghapusan. Pilih Hapus klaster.

Pada halaman daftar cluster, status cluster diperbarui saat cluster dihapus.

Setelah Anda menyelesaikan tutorial ini, Anda dapat menemukan informasi lebih lanjut tentang Amazon Redshift dan langkah selanjutnya. Sumber daya tambahan untuk mempelajari tentang Amazon Redshift

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Memulai dengan gudang data tanpa server

Tentukan dan gunakan database di gudang data Anda

Topik berikutnya:

Tentukan dan gunakan database di gudang data Anda

Topik sebelumnya:

Memulai dengan gudang data tanpa server

Perlu bantuan?

Di halaman ini

Pilih preferensi cookie Anda

Sesuaikan preferensi cookie

Penting

Kinerja

Fungsional

Iklan

Tidak dapat menyimpan preferensi cookie

Memulai gudang data yang disediakan Amazon Redshift

penting

Topik

Tentukan aturan firewall

catatan

Langkah 1: Buat contoh cluster Amazon Redshift

Untuk membuat cluster Amazon Redshift

penting

catatan

Langkah 2: Konfigurasikan aturan masuk untuk klien SQL

catatan

Untuk memeriksa firewall Anda dan memberikan akses masuk ke cluster Anda

Langkah 3: Berikan akses ke klien SQL dan jalankan kueri

Memberikan akses ke editor kueri v2

Langkah 4: Muat data dari Amazon S3 ke Amazon Redshift

Memuat data dari Amazon S3 menggunakan perintah SQL

Untuk membuat dan memuat data menggunakan klien SQL seperti editor kueri v2

catatan

Memuat data dari Amazon S3 menggunakan editor kueri v2

Buat data TICKIT di klaster Anda

Langkah 5: Coba contoh kueri menggunakan editor kueri

catatan

Langkah 6: Setel ulang lingkungan Anda

Untuk menghapus klaster

Topik berikutnya:

Topik sebelumnya:

Perlu bantuan?

Di halaman ini

Related resources

Apakah halaman ini membantu Anda?

Related resources

Langkah-langkah dalam tutorial ini, diuraikan berikut