

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Mengunggah Data ke Domain Amazon CloudSearch
<a name="uploading-data"></a>

**penting**  
Sebelum mengunggah data ke CloudSearch domain Amazon, ikuti panduan berikut:  
Kelompokkan dokumen ke dalam *batch* sebelum Anda mengunggahnya. Mengunggah batch yang hanya terdiri dari satu dokumen memiliki dampak negatif yang besar pada kecepatan Amazon CloudSearch dapat memproses pembaruan Anda. Sebagai gantinya, buat batch yang sedekat mungkin dengan batas dan unggah lebih jarang. Untuk informasi selengkapnya tentang ukuran batch maksimum dan frekuensi unggah, lihat[Memahami CloudSearch Batas Amazon](limits.md).
Dokumen domain dan titik akhir pencarian tetap sama untuk masa pakai domain. Anda harus men-cache titik akhir daripada mengambilnya sebelum setiap permintaan unggahan atau pencarian. Menanyakan layanan CloudSearch konfigurasi Amazon dengan menelepon `aws cloudsearch describe-domains` atau `DescribeDomains` sebelum setiap permintaan kemungkinan akan mengakibatkan permintaan Anda dibatasi.

Anda membuat kumpulan dokumen untuk menggambarkan data yang ingin Anda unggah ke CloudSearch domain Amazon. Kumpulan dokumen adalah kumpulan operasi tambah dan hapus yang mewakili dokumen yang ingin Anda tambahkan, perbarui, atau hapus dari domain Anda. Batch dapat dijelaskan dalam JSON atau XHTML. Saat Anda mengunggah batch dokumen ke domain, data diindeks secara otomatis sesuai dengan opsi pengindeksan domain.

Saat data Anda berubah, Anda mengunggah batch untuk menambah, mengubah, atau menghapus dokumen dari indeks Anda. Amazon CloudSearch menerapkan pembaruan terus menerus. Anda hanya perlu secara eksplisit mengindeks ulang data Anda ketika Anda membuat perubahan konfigurasi yang menempatkan domain Anda dalam `NEEDS INDEXING` status atau perlu memperbarui pemberi saran. 

**Untuk mengunggah data ke domain Anda, itu harus diformat sebagai batch JSON atau XHTML yang valid.** Bidang yang ditentukan dalam setiap dokumen harus sesuai dengan bidang indeks yang dikonfigurasi untuk domain. Namun, dokumen tidak harus berisi setiap bidang indeks yang dikonfigurasi. Untuk informasi tentang membuat kumpulan dokumen, lihat[Mempersiapkan Data Anda](preparing-data.md). Untuk informasi tentang mengonfigurasi bidang indeks untuk domain, lihat[Mengkonfigurasi Bidang Indeks](configuring-index-fields.md).

Anda ditagih untuk jumlah total kumpulan dokumen yang diunggah ke domain pencarian Anda, termasuk batch yang berisi operasi penghapusan. Untuk informasi selengkapnya tentang CloudSearch harga Amazon, lihat [aws.amazon. com/cloudsearch/pricing](https://aws.amazon.com/cloudsearch/pricing/)/.

Anda dapat mengirimkan kumpulan dokumen ke domain menggunakan[Amazon CloudSearch console](#uploading-data-console), AWS CLI, atau dengan [posting it directly](#uploading-data-api) ke endpoint layanan dokumen domain.

Untuk informasi selengkapnya tentang API layanan dokumen, lihat[Referensi API Layanan Dokumen](document-service-api.md).

**Topics**
+ [Mengirimkan Permintaan Unggahan Dokumen ke Domain Amazon CloudSearch](submitting-doc-requests.md)
+ [Unggahan Massal di Amazon CloudSearch](#bulk-uploads)
+ [Amazon CloudSearch console](#uploading-data-console)
+ [Mengunggah Data Menggunakan AWS CLI](#uploading-data-clt)
+ [posting it directly](#uploading-data-api)

# Mengirimkan Permintaan Unggahan Dokumen ke Domain Amazon CloudSearch
<a name="submitting-doc-requests"></a>

**penting**  
Sebelum mengunggah data ke CloudSearch domain Amazon, ikuti panduan berikut:  
Kelompokkan dokumen ke dalam *batch* sebelum Anda mengunggahnya. Mengunggah batch yang hanya terdiri dari satu dokumen memiliki dampak negatif yang besar pada kecepatan Amazon CloudSearch dapat memproses pembaruan Anda. Sebagai gantinya, buat batch yang sedekat mungkin dengan batas dan unggah lebih jarang. Untuk informasi selengkapnya tentang ukuran batch maksimum dan frekuensi unggah, lihat[Memahami CloudSearch Batas Amazon](limits.md).
Dokumen domain dan titik akhir pencarian tetap sama untuk masa pakai domain. Anda harus men-cache titik akhir daripada mengambilnya sebelum setiap permintaan unggahan atau pencarian. Menanyakan layanan CloudSearch konfigurasi Amazon dengan menelepon `aws cloudsearch describe-domains` atau `DescribeDomains` sebelum setiap permintaan kemungkinan akan mengakibatkan permintaan Anda dibatasi.

Sebaiknya gunakan salah satu AWS SDKs atau AWS CLI untuk mengirimkan permintaan unggahan dokumen. AWS CLI Menangani SDKs dan menangani penandatanganan permintaan untuk Anda dan menyediakan cara mudah untuk melakukan semua CloudSearch tindakan Amazon. Anda juga dapat menggunakan CloudSearch konsol Amazon untuk mengunggah batch individual dan mengimpor data dari DynamoDB atau S3.

Misalnya, permintaan berikut mengunggah batch menggunakan file. AWS CLI

```
aws cloudsearchdomain --endpoint-url http://doc-movies-y6gelr4lv3jeu4rvoelunxsl2e.us-east-1.cloudsearch.amazonaws.com upload-documents --content-type
 application/json --documents movie-data-2013.json
```

Untuk tujuan pengembangan dan pengujian, Anda dapat mengizinkan akses anonim ke layanan dokumen domain Anda dan mengirimkan permintaan HTTP POST yang tidak ditandatangani langsung ke layanan dokumen domain Anda. Di lingkungan produksi, batasi akses ke domain Anda ke peran, grup, atau pengguna IAM tertentu dan kirimkan permintaan yang ditandatangani. Untuk informasi tentang mengontrol akses untuk Amazon CloudSearch, lihat[Mengkonfigurasi Akses untuk Amazon CloudSearch](configuring-access.md). Untuk informasi selengkapnya tentang penandatanganan permintaan, lihat [Menandatangani Permintaan AWS API](https://docs.aws.amazon.com/general/latest/gr/signing_aws_api_requests.html). 

Misalnya, permintaan POST berikut mengunggah sekumpulan dokumen yang diformat dalam JSON ke titik akhir domain doc-movies-123456789012.us-east-1.cloudsearch.amazonaws.com.

```
curl -X POST --upload-file data1.json doc-movies-123456789012.us-east-1.cloudsearch.amazonaws.com/2013-01-01/documents/batch --header "Content-Type: application/json"
```

## Unggahan Massal di Amazon CloudSearch
<a name="bulk-uploads"></a>

Batch dokumen dibatasi hingga satu batch setiap 10 detik dan 5 MB per batch. Untuk mempelajari lebih lanjut, lihat [Batas](limits.md). Namun, Anda dapat mengunggah batch secara paralel untuk mengurangi jumlah waktu yang diperlukan untuk mengunggah semua data Anda.

Untuk melakukan upload massal:
+ Setel jenis instans yang Anda inginkan ke jenis instans yang lebih besar daripada default`search.small`. Jumlah utas unggahan yang dapat Anda gunakan tergantung pada jenis contoh pencarian yang digunakan domain Anda dan sifat data dan opsi pengindeksan Anda. Jenis instans yang lebih besar memiliki kapasitas unggah yang lebih tinggi. Mencoba mengunggah batch secara paralel dengan `search.small` instance biasanya menghasilkan tingkat kesalahan 504 atau 507 yang tinggi. Untuk informasi selengkapnya tentang menyetel jenis instans yang diinginkan, lihat[Mengkonfigurasi Opsi Penskalaan di Amazon CloudSearch](configuring-scaling-options.md).
+ Mulai unggah data setelah perubahan konfigurasi Anda aktif. Jika Anda menemukan tingkat kesalahan 5xx yang tinggi, Anda perlu mengurangi tingkat unggah atau beralih ke jenis instans yang lebih besar. Jika Anda sudah menggunakan jenis instans terbesar, Anda dapat meningkatkan jumlah partisi yang diinginkan untuk lebih meningkatkan kapasitas unggah. 
**penting**  
Jika Anda mengirimkan sejumlah besar pembaruan saat domain Anda berada dalam status PEMROSESAN, itu dapat meningkatkan jumlah waktu yang diperlukan untuk pembaruan untuk diterapkan ke indeks pencarian Anda. Untuk menghindari kelambatan pembaruan ini, tunggu hingga domain Anda dalam status AKTIF sebelum memulai unggahan massal Anda.
+ Setelah selesai dengan upload massal, Anda dapat mengubah jenis instans yang diinginkan kembali ke jenis instans yang lebih kecil. Jika indeks Anda cocok dengan tipe yang lebih kecil, Amazon CloudSearch akan secara otomatis menskalakan domain Anda kembali. Amazon tidak CloudSearch akan menskalakan ke jenis instans yang lebih kecil dari jenis instans yang diinginkan yang dikonfigurasi untuk domain Anda. 

 Untuk kumpulan data kurang dari 1 GB data atau kurang dari satu juta dokumen 1 KB, contoh pencarian kecil harus cukup. Untuk mengunggah kumpulan data antara 1 GB dan 8 GB, sebaiknya atur jenis instans yang diinginkan `search.large` sebelum Anda mulai mengunggah. Untuk kumpulan data antara 8 GB dan 16 GB, mulailah dengan file. `search.xlarge` Untuk kumpulan data antara 16 GB dan 32 GB, mulailah dengan file. `search.2xlarge` Jika Anda memiliki lebih dari 32 GB untuk diunggah, pilih jenis `search.2xlarge` instans dan tingkatkan jumlah partisi yang diinginkan untuk mengakomodasi kumpulan data Anda. Setiap partisi dapat berisi hingga 32 GB data. Kirim [Permintaan Batas Peningkatan Layanan](https://console.aws.amazon.com/support/home#/case/create?issueType=service-limit-increase&limitType=service-code-cloudsearch-partitions-and-instances) jika Anda membutuhkan kapasitas unggah lebih besar atau memiliki lebih dari 500 GB untuk diindeks. 

## Mengunggah Data Menggunakan Konsol Amazon CloudSearch
<a name="uploading-data-console"></a>

Di CloudSearch konsol Amazon, Anda dapat mengunggah data dari sistem file lokal atau Amazon S3 ke domain Anda dari dasbor domain. Konsol dapat secara otomatis mengonversi jenis file berikut ke kumpulan dokumen selama proses pengunggahan: 
+ Batch dokumen diformat dalam JSON atau XML.json, .xml.
+ Nilai Terpisah Koma (.csv)
+ Dokumen Teks (.txt)

Anda juga dapat mengonversi dan mengunggah item dari tabel DynamoDB. Untuk informasi selengkapnya, lihat [Uploading DynamoDB Data](searching-dynamodb-data.md#searching-dynamodb-data-console).

**catatan**  
Untuk mengunggah data dari Amazon S3 atau DynamoDB, Anda harus memiliki izin untuk mengakses layanan dan sumber daya yang ingin Anda unggah. Untuk informasi selengkapnya, lihat [Menggunakan Kebijakan Bucket dan Kebijakan Pengguna dan](https://docs.aws.amazon.com/AmazonS3/latest/userguide/UsingIAMPolicies.html) [Menggunakan IAM untuk Mengontrol Akses ke Sumber Daya DynamoDB](https://docs.aws.amazon.com/amazondynamodb/latest/developerguide/UsingIAMWithDDB.html).

File CSV diurai row-by-row dan dokumen terpisah dibuat untuk setiap baris. Semua jenis file lainnya diperlakukan sebagai satu dokumen. Untuk informasi selengkapnya tentang membuat batch dokumen secara otomatis, lihat[Mempersiapkan Data Anda](preparing-data.md).

**Untuk mengirim data ke domain untuk pengindeksan**

1. Buka CloudSearch konsol Amazon di [https://console.aws.amazon.com/cloudsearch/rumah](https://console.aws.amazon.com/cloudsearch/home).

1. Di panel navigasi kiri, pilih **Domain**.

1. Pilih nama domain Anda untuk membuka konfigurasi domain.

1. Pilih **Tindakan**, **Unggah dokumen**.

1. Pilih lokasi data yang ingin Anda unggah ke domain Anda:
   + Mesin lokal
   + Amazon S3
   + Amazon DynamoDB
   + Data sampel

   Jika Anda mengunggah data yang tidak diformat sebagai kumpulan dokumen, maka secara otomatis akan dikonversi selama proses pengunggahan.
**catatan**  
 Jika batch tidak valid, Amazon CloudSearch mengonversi konten menjadi kumpulan valid yang berisi satu bidang konten dan bidang metadata generik. Karena ini biasanya bukan bidang yang dikonfigurasi untuk domain, Anda akan mendapatkan kesalahan yang menyatakan bahwa bidang tidak ada.

1. Unggah data Anda.

   1. Jika Anda mengunggah file lokal, pilih **Pilih file** untuk menemukan file yang akan diunggah.

   1. Jika Anda mengunggah objek dari Amazon S3, berikan URI bucket untuk diunggah.

   1. Jika Anda mengunggah item dari DynamoDB, pilih tabel untuk diunggah. Untuk membatasi unit kapasitas baca yang dapat dikonsumsi saat membaca dari tabel, masukkan persentase maksimum unit kapasitas baca. Untuk mulai membaca dari item tertentu, tentukan kunci hash mulai.

   1. Jika Anda mengunggah data sampel yang telah ditentukan sebelumnya, pilih kumpulan data yang akan digunakan.

1. Pilih **Lanjutkan**.

1. Tinjau dokumen yang akan diunggah dan pilih **Unggah dokumen**.

1. Dalam **Ringkasan Unggah**, jika kumpulan dokumen telah dibuat secara otomatis dari data Anda, Anda dapat memilih **Unduh kumpulan dokumen yang dihasilkan** untuk mendapatkannya. Pilih **Tutup** untuk kembali ke dasbor domain. 

## Mengunggah Data Menggunakan AWS CLI
<a name="uploading-data-clt"></a>

Anda menggunakan `aws cloudsearch upload-documents` perintah untuk mengirim batch dokumen ke domain pencarian Anda. Untuk informasi tentang menginstal dan menyiapkan AWS CLI, lihat [Panduan AWS Command Line Interface Pengguna](https://docs.aws.amazon.com/cli/latest/userguide/). 

**Untuk mengirim batch dokumen ke domain untuk pengindeksan**
+ Jalankan `aws cloudsearchdomain upload-documents` perintah untuk mengunggah batch Anda ke domain Anda:

  ```
  aws cloudsearchdomain upload-documents --endpoint-url http://doc-movies-y6gelr4lv3jeu4rvoelunxsl2e.us-east-1.cloudsearch.amazonaws.com --content-type application/json --documents document-batch.json
  {
      "status": "success", 
      "adds": 5000, 
      "deletes": 0
  }
  ```

## Memposting Dokumen ke Endpoint Layanan Dokumen CloudSearch Domain Amazon melalui HTTP
<a name="uploading-data-api"></a>

Anda menggunakan `dokumen/batch` sumber daya untuk memposting batch dokumen ke domain Anda untuk menambah, memperbarui, atau menghapus dokumen. Misalnya:

```
curl -X POST --upload-file movie-data-2013.json doc-movies-123456789012.us-east-1.cloudsearch.amazonaws.com/2013-01-01/documents/batch --header "Content-Type:application/json"
```