

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Membuat kumpulan data menggunakan file Amazon S3
<a name="create-a-data-set-s3"></a>

Untuk membuat kumpulan data menggunakan satu atau beberapa file teks (.csv, .tsv, .clf, atau .elf) dari Amazon S3, buat manifes untuk Quick Sight. Quick Sight menggunakan manifes ini untuk mengidentifikasi file yang ingin Anda gunakan dan pengaturan unggah yang diperlukan untuk mengimpornya. Saat Anda membuat kumpulan data menggunakan Amazon S3, data file secara otomatis diimpor. [SPICE](spice.md)

Anda harus memberikan akses Quick Sight ke bucket Amazon S3 mana pun yang ingin Anda baca file. Untuk informasi tentang memberikan akses Quick Sight ke AWS sumber daya, lihat[Mengonfigurasi akses Amazon Quick Sight ke sumber AWS data](access-to-aws-resources.md).

**Topics**
+ [Format yang didukung untuk file manifes Amazon S3](supported-manifest-file-format.md)
+ [Membuat kumpulan data Amazon S3](create-a-data-set-s3-procedure.md)
+ [Dataset menggunakan file S3 di akun lain AWS](using-s3-files-in-another-aws-account.md)

# Format yang didukung untuk file manifes Amazon S3
<a name="supported-manifest-file-format"></a>

Anda menggunakan file manifes JSON untuk menentukan file di Amazon S3 untuk diimpor ke Quick Sight. File manifes JSON ini dapat menggunakan format Quick Sight yang dijelaskan berikut ini atau format Amazon Redshift yang dijelaskan [dalam Menggunakan manifes untuk menentukan file data](https://docs.aws.amazon.com/redshift/latest/dg/loading-data-files-using-manifest.html) dalam Panduan Pengembang Database *Amazon Redshift*. Anda tidak perlu menggunakan Amazon Redshift untuk menggunakan format file manifes Amazon Redshift. 

Jika Anda menggunakan file manifes Quick Sight, itu harus memiliki ekstensi.json, misalnya. `my_manifest.json` Jika Anda menggunakan file manifes Amazon Redshift, file tersebut dapat memiliki ekstensi apa pun. 

Jika Anda menggunakan file manifes Amazon Redshift, Quick Sight akan memproses `mandatory` opsi opsional seperti yang dilakukan Amazon Redshift. Jika file terkait tidak ditemukan, Quick Sight mengakhiri proses impor dan mengembalikan kesalahan. 

File yang Anda pilih untuk diimpor harus berupa teks yang dibatasi (misalnya, .csv atau.tsv), log (.clf), atau format log diperpanjang (.elf), atau JSON (.json). Semua file yang diidentifikasi dalam satu file manifes harus menggunakan format file yang sama. Plus, mereka harus memiliki jumlah dan jenis kolom yang sama. Quick Sight mendukung pengkodean file UTF-8, tetapi tidak UTF-8 dengan tanda urutan byte (BOM). Jika Anda mengimpor file JSON, maka untuk `globalUploadSettings` tentukan`format`, tetapi tidak, `delimiter``textqualifier`, atau. `containsHeader`

Pastikan file apa pun yang Anda tentukan ada di bucket Amazon S3 yang telah Anda berikan akses Quick Sight. Untuk informasi tentang memberikan akses Quick Sight ke AWS sumber daya, lihat[Mengonfigurasi akses Amazon Quick Sight ke sumber AWS data](access-to-aws-resources.md).

## Format file manifes untuk Quick Sight
<a name="quicksight-manifest-file-format"></a>

File manifes Quick Sight menggunakan format JSON berikut.

```
{
    "fileLocations": [
        {
            "URIs": [
                "uri1",
                "uri2",
                "uri3"
            ]
        },
        {
            "URIPrefixes": [
                "prefix1",
                "prefix2",
                "prefix3"
            ]
        }
    ],
    "globalUploadSettings": {
        "format": "JSON",
        "delimiter": ",",
        "textqualifier": "'",
        "containsHeader": "true"
    }
}
```

Gunakan bidang dalam `fileLocations` elemen untuk menentukan file yang akan diimpor, dan bidang dalam `globalUploadSettings` elemen untuk menentukan pengaturan impor untuk file-file tersebut, seperti pembatas bidang. 

Elemen file manifes dijelaskan sebagai berikut:
+ **FileLocations** - Gunakan elemen ini untuk menentukan file yang akan diimpor. Anda dapat menggunakan salah satu atau kedua `URIPrefixes` array `URIs` dan untuk melakukan ini. Anda harus menentukan setidaknya satu nilai dalam satu atau yang lain dari mereka.
  + **URIs**— Gunakan array ini untuk daftar file tertentu URIs untuk diimpor.

    Quick Sight dapat mengakses file Amazon S3 yang ada di mana saja. Wilayah AWS Namun, Anda harus menggunakan format URI yang mengidentifikasi AWS Wilayah bucket Amazon S3 jika berbeda dengan yang digunakan oleh akun Cepat Anda.

    URIs dalam format berikut didukung.  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/quick/latest/userguide/supported-manifest-file-format.html)
  + **URIPrefixes**— Gunakan array ini untuk mencantumkan awalan URI untuk bucket dan folder S3. Semua file dalam ember atau folder tertentu diimpor. Quick Sight secara rekursif mengambil file dari folder anak.

    Quick Sight dapat mengakses bucket Amazon S3 atau folder yang ada di mana saja. Wilayah AWS Pastikan untuk menggunakan format awalan URI yang mengidentifikasi bucket S3 Wilayah AWS jika berbeda dengan yang digunakan oleh akun Quick Anda.

    Awalan URI dalam format berikut didukung.  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/id_id/quick/latest/userguide/supported-manifest-file-format.html)
+ **globalUploadSettings**— (Opsional) Gunakan elemen ini untuk menentukan pengaturan impor untuk file Amazon S3, seperti pembatas bidang. Jika elemen ini tidak ditentukan, Quick Sight menggunakan nilai default untuk bidang di bagian ini.
**penting**  
Untuk file log (.clf) dan log diperpanjang (.elf), hanya bidang **format** di bagian ini yang berlaku, sehingga Anda dapat melewati bidang lainnya. Jika Anda memilih untuk memasukkannya, nilainya diabaikan. 
  + **format** — (Opsional) Tentukan format file yang akan diimpor. Format yang valid adalah**CSV**,**TSV**,**CLF**,**ELF**, dan**JSON**. Nilai default-nya adalah **CSV**.
  + **pembatas** - (Opsional) Tentukan pembatas bidang file. Ini harus dipetakan ke jenis file yang ditentukan di `format` bidang. Format yang valid adalah koma (**,**) untuk file.csv dan tab (**\$1t**) untuk file.tsv. Nilai defaultnya adalah koma (**,**).
  + **textqualifier** - (Opsional) Tentukan kualifikasi teks file. Format yang valid adalah kutipan tunggal (**'**), tanda kutip ganda (**\$1"**). Backslash terkemuka adalah karakter escape yang diperlukan untuk kutipan ganda di JSON. Nilai default adalah tanda kutip ganda (**\$1"**). Jika teks Anda tidak memerlukan kualifikasi teks, jangan sertakan properti ini.
  + **ContainsHeader** - (Opsional) Tentukan apakah file memiliki baris header. Format yang valid adalah **true** atau**false**. Nilai default-nya adalah **true**.

### Contoh file manifes untuk Quick Sight
<a name="quicksight-manifest-file-examples"></a>

Berikut ini adalah beberapa contoh file manifes Quick Sight yang lengkap.

Contoh berikut menunjukkan file manifes yang mengidentifikasi dua file.csv tertentu untuk impor. File-file ini menggunakan tanda kutip ganda untuk kualifikasi teks. `containsHeader`Bidang `format``delimiter`,, dan dilewati karena nilai default dapat diterima.

```
{
    "fileLocations": [
        {
            "URIs": [
                "https://yourBucket.s3.amazonaws.com/data-file.csv",
                "https://yourBucket.s3.amazonaws.com/data-file-2.csv"
            ]
        }
    ],
    "globalUploadSettings": {
        "textqualifier": "\""
    }
}
```

Contoh berikut menunjukkan file manifes yang mengidentifikasi satu file.tsv tertentu untuk impor. File ini juga menyertakan bucket di AWS Wilayah lain yang berisi file.tsv tambahan untuk diimpor. `containsHeader`Bidang `textqualifier` dan dilewati karena nilai default dapat diterima.

```
{
    "fileLocations": [
        {
            "URIs": [
                "https://s3.amazonaws.com/amzn-s3-demo-bucket/data.tsv"
            ]
        },
        {
            "URIPrefixes": [
                "https://s3-us-east-1.amazonaws.com/amzn-s3-demo-bucket/"
            ]
        }
    ],
    "globalUploadSettings": {
        "format": "TSV",
        "delimiter": "\t"
    }
}
```

Contoh berikut mengidentifikasi dua bucket yang berisi file.clf untuk impor. Satu Wilayah AWS sama dengan akun Cepat, dan satu di akun yang berbeda Wilayah AWS. `containsHeader`Bidang `delimiter``textqualifier`,, dan dilewati karena tidak berlaku untuk file log.

```
{
    "fileLocations": [
        {
            "URIPrefixes": [
                "https://amzn-s3-demo-bucket1.your-s3-url.com",
                "s3://amzn-s3-demo-bucket2/"
            ]
        }
    ],
    "globalUploadSettings": {
        "format": "CLF"
    }
}
```

Contoh berikut menggunakan format Amazon Redshift untuk mengidentifikasi file.csv untuk diimpor.

```
{
    "entries": [
        {
            "url": "https://amzn-s3-demo-bucket.your-s3-url.com/myalias-test/file-to-import.csv",
            "mandatory": true
        }
    ]
}
```

Contoh berikut menggunakan format Amazon Redshift untuk mengidentifikasi dua file JSON untuk diimpor.

```
{
    "fileLocations": [
        {
            "URIs": [
                "https://yourBucket.s3.amazonaws.com/data-file.json",
                "https://yourBucket.s3.amazonaws.com/data-file-2.json"
            ]
        }
    ],
    "globalUploadSettings": {
        "format": "JSON"
    }
}
```

# Membuat kumpulan data Amazon S3
<a name="create-a-data-set-s3-procedure"></a>

**Untuk membuat kumpulan data Amazon S3**

1. Periksa [Kuota sumber data](data-source-limits.md) untuk memastikan bahwa set file target Anda tidak melebihi kuota sumber data.

1. Buat file manifes untuk mengidentifikasi file teks yang ingin Anda impor, menggunakan salah satu format yang ditentukan[Format yang didukung untuk file manifes Amazon S3](supported-manifest-file-format.md).

1. Simpan file manifes ke direktori lokal, atau unggah ke Amazon S3.

1. Pada halaman Mulai cepat, pilih **Data**.

1. Pada halaman **Data**, pilih **Buat** lalu **Dataset baru**.

1. **Pilih ikon Amazon S3 dan kemudian pilih Berikutnya.**

1. Untuk **nama sumber data**, masukkan deskripsi sumber data. Nama ini harus menjadi sesuatu yang membantu Anda membedakan sumber data ini dari yang lain.

1. Untuk **Unggah file manifes**, lakukan salah satu hal berikut:
   + Untuk menggunakan file manifes lokal, pilih **Unggah**, lalu pilih **Unggah file manifes JSON**. Untuk **Buka**, pilih file, lalu pilih **Buka**.
   + Untuk menggunakan file manifes dari Amazon S3, pilih **URL**, dan masukkan URL untuk file manifes. Untuk menemukan URL file manifes yang sudah ada sebelumnya di konsol Amazon S3, navigasikan ke file yang sesuai dan pilih file tersebut. Panel properti ditampilkan, termasuk URL tautan. Anda dapat menyalin URL dan menempelkannya ke Quick Sight.

1. Pilih **Hubungkan**.

1. Untuk memastikan koneksi selesai, pilih **Edit/Pratinjau data**. Jika tidak, pilih **Visualisasikan** untuk membuat analisis menggunakan data apa adanya. 

   Jika Anda memilih **Edit/Pratinjau data**, Anda dapat menentukan nama kumpulan data sebagai bagian dari persiapan data. Jika tidak, nama dataset cocok dengan nama file manifes. 

   Untuk mempelajari lebih lanjut tentang persiapan data, lihat[Mempersiapkan data di Amazon Quick Sight](preparing-data.md).

## Membuat kumpulan data berdasarkan beberapa file Amazon S3
<a name="data-sets-based-on-multiple-s3-files"></a>

Anda dapat menggunakan salah satu dari beberapa metode untuk menggabungkan atau menggabungkan file dari bucket Amazon S3 di dalam Quick Sight:
+ **Gabungkan file dengan menggunakan manifes** — Dalam hal ini, file harus memiliki jumlah bidang (kolom) yang sama. Tipe data harus cocok antar bidang di posisi yang sama dalam file. Misalnya, bidang pertama harus memiliki tipe data yang sama di setiap file. Hal yang sama berlaku untuk bidang kedua, dan bidang ketiga, dan seterusnya. Quick Sight mengambil nama bidang dari file pertama.

  File harus terdaftar secara eksplisit dalam manifes. Namun, mereka tidak harus berada di dalam ember Amazon S3 yang sama.

  Selain itu, file harus mengikuti aturan yang dijelaskan dalam[Format yang didukung untuk file manifes Amazon S3](supported-manifest-file-format.md).

  Untuk detail selengkapnya tentang menggabungkan file menggunakan manifes, lihat[Membuat kumpulan data menggunakan file Amazon S3](create-a-data-set-s3.md).
+ **Gabungkan file tanpa menggunakan manifes** — Untuk menggabungkan beberapa file menjadi satu tanpa harus mencantumkannya satu per satu dalam manifes, Anda dapat menggunakan Athena. Dengan metode ini, Anda cukup menanyakan file teks Anda, seperti yang ada di tabel dalam database. Untuk informasi lebih lanjut, lihat posting [Menganalisis data di Amazon S3 menggunakan Athena](https://aws.amazon.com/blogs/big-data/analyzing-data-in-s3-using-amazon-athena/) di blog Big Data. 
+ **Gunakan skrip untuk menambahkan file sebelum mengimpor** - Anda dapat menggunakan skrip yang dirancang untuk menggabungkan file Anda sebelum mengunggah. 

# Dataset menggunakan file S3 di akun lain AWS
<a name="using-s3-files-in-another-aws-account"></a>

Gunakan bagian ini untuk mempelajari cara mengatur keamanan sehingga Anda dapat menggunakan Quick Sight untuk mengakses file Amazon S3 di akun lain AWS . 

Agar Anda dapat mengakses file di akun lain, pemilik akun lain harus terlebih dahulu mengatur Amazon S3 untuk memberi Anda izin membaca file tersebut. Kemudian, di Quick Sight, Anda harus mengatur akses ke bucket yang dibagikan dengan Anda. Setelah kedua langkah ini selesai, Anda dapat menggunakan manifes untuk membuat kumpulan data.

**catatan**  
 Untuk mengakses file yang dibagikan dengan publik, Anda tidak perlu mengatur keamanan khusus apa pun. Namun, Anda masih memerlukan file manifes.

**Topics**
+ [Menyiapkan Amazon S3 untuk memungkinkan akses dari akun Cepat yang berbeda](#setup-S3-to-allow-access-from-a-different-quicksight-account)
+ [Menyiapkan Quick Sight untuk mengakses file Amazon S3 di akun lain AWS](#setup-quicksight-to-access-S3-in-a-different-account)

## Menyiapkan Amazon S3 untuk memungkinkan akses dari akun Cepat yang berbeda
<a name="setup-S3-to-allow-access-from-a-different-quicksight-account"></a>

Gunakan bagian ini untuk mempelajari cara mengatur izin di file Amazon S3 sehingga dapat diakses oleh Quick Sight di AWS akun lain. 

Untuk informasi tentang mengakses file Amazon S3 akun lain dari akun Quick Sight Anda, lihat. [Menyiapkan Quick Sight untuk mengakses file Amazon S3 di akun lain AWS](#setup-quicksight-to-access-S3-in-a-different-account) Untuk informasi selengkapnya tentang izin S3, lihat [Mengelola izin akses ke sumber daya Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/dev/s3-access-control.html) Anda dan [Bagaimana cara menyetel](https://docs.aws.amazon.com/AmazonS3/latest/user-guide/set-object-permissions.html) izin pada objek?

Anda dapat menggunakan prosedur berikut untuk mengatur akses ini dari konsol S3. Atau Anda dapat memberikan izin dengan menggunakan AWS CLI atau dengan menulis skrip. Jika Anda memiliki banyak file untuk dibagikan, Anda dapat membuat kebijakan bucket S3 tentang `s3:GetObject` tindakan tersebut. Untuk menggunakan kebijakan bucket, tambahkan ke izin bucket, bukan ke izin file. Untuk informasi tentang kebijakan bucket, lihat [contoh kebijakan Bucket](https://docs.aws.amazon.com/AmazonS3/latest/dev/example-bucket-policies.html) di Panduan *Pengembang Amazon S3*.

**Untuk mengatur akses dari akun Cepat yang berbeda dari konsol S3**

1. Dapatkan alamat email email AWS akun yang ingin Anda bagikan. Atau Anda bisa mendapatkan dan menggunakan ID pengguna kanonik. *Untuk informasi selengkapnya tentang pengguna kanonik IDs, lihat [pengenal AWS akun](https://docs.aws.amazon.com/general/latest/gr/acct-identifiers.html) di Referensi Umum.AWS *

1. Masuk ke Konsol Manajemen AWS dan buka konsol Amazon S3 di. [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/)

1. Temukan bucket Amazon S3 yang ingin Anda bagikan dengan Quick Sight. Pilih **Izin**.

1. Pilih **Tambah Akun**, lalu masukkan alamat email, atau tempel ID pengguna kanonik, untuk AWS akun yang ingin Anda bagikan. Alamat email ini harus menjadi yang utama untuk AWS akun. 

1. Pilih **Ya** untuk **izin baca bucket** dan **objek List**.

   Pilih **Simpan** untuk mengonfirmasi.

1. Temukan file yang ingin Anda bagikan, dan buka pengaturan izin file. 

1. Masukkan alamat email atau ID pengguna kanonik untuk AWS akun yang ingin Anda bagikan. Alamat email ini harus menjadi yang utama untuk AWS akun. 

1. Aktifkan izin **objek Baca** untuk setiap file yang perlu diakses Quick Sight. 

1. Beri tahu pengguna Cepat bahwa file sekarang tersedia untuk digunakan.

## Menyiapkan Quick Sight untuk mengakses file Amazon S3 di akun lain AWS
<a name="setup-quicksight-to-access-S3-in-a-different-account"></a>

Gunakan bagian ini untuk mempelajari cara mengatur Quick Sight sehingga Anda dapat mengakses file Amazon S3 di akun lain AWS . Untuk informasi tentang mengizinkan orang lain mengakses file Amazon S3 Anda dari akun Cepat mereka, lihat. [Menyiapkan Amazon S3 untuk memungkinkan akses dari akun Cepat yang berbeda](#setup-S3-to-allow-access-from-a-different-quicksight-account)

Gunakan prosedur berikut untuk mengakses file Amazon S3 akun lain dari Quick Sight. Sebelum Anda dapat menggunakan prosedur ini, pengguna di AWS akun lain harus berbagi file di ember Amazon S3 mereka dengan Anda.

**Untuk mengakses file Amazon S3 akun lain dari Quick Sight**

1. Verifikasi bahwa pengguna atau pengguna di AWS akun lain memberikan izin baca dan tulis akun Anda ke bucket S3 yang dimaksud. 

1. Pilih ikon profil Anda, lalu pilih **Kelola Penglihatan Cepat**.

1. Pilih **Keamanan & izin**.

1. Di bawah **akses Quick Sight ke AWS layanan**, pilih **Kelola**.

1. Pilih **Pilih ember S3**.

1. Pada layar **Select Amazon S3 bucket, pilih bucket** **S3 yang dapat Anda akses di** tab. AWS

   Tab default bernama **bucket S3 yang ditautkan ke akun Quick Sight**. Ini menunjukkan semua bucket akun Cepat Anda memiliki akses ke. 

1. Lakukan salah satu tindakan berikut:
   + Untuk menambahkan semua bucket yang memiliki izin untuk digunakan, pilih **Pilih bucket yang dapat diakses dari akun lain AWS **. 
   + Jika Anda memiliki satu atau lebih bucket Amazon S3 yang ingin Anda tambahkan, masukkan namanya. Masing-masing harus sama persis dengan nama unik bucket Amazon S3.

     Jika Anda tidak memiliki izin yang sesuai, Anda melihat pesan kesalahan “Kami tidak dapat terhubung ke bucket S3 ini. Pastikan bahwa setiap bucket S3 yang Anda tentukan terkait dengan AWS akun yang digunakan untuk membuat akun Cepat ini. Pesan galat ini muncul jika Anda tidak memiliki izin akun atau izin Quick Sight.
**catatan**  
Untuk menggunakan Amazon Athena, Quick Sight perlu mengakses bucket Amazon S3 yang digunakan Athena.   
Anda dapat menambahkannya di sini satu per satu, atau menggunakan opsi **Pilih bucket yang dapat diakses dari AWS akun lain**.

1. Pilih **Pilih bucket** untuk mengonfirmasi pilihan Anda. 

1. Buat kumpulan data baru berdasarkan Amazon S3, dan unggah file manifes Anda. Untuk informasi selengkapnya kumpulan data Amazon S3, lihat. [Membuat kumpulan data menggunakan file Amazon S3](create-a-data-set-s3.md)