Mengonfigurasi Bidang Indeks untuk Domain Amazon CloudSearch - Amazon CloudSearch

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mengonfigurasi Bidang Indeks untuk Domain Amazon CloudSearch

Setiap dokumen yang Anda tambahkan ke domain pencarian Anda memiliki kumpulan bidang yang berisi data yang dapat dicari atau dikembalikan. Setiap dokumen harus memiliki ID dokumen unik dan setidaknya satu bidang.

Dalam konfigurasi domain Anda, Anda menentukan bidang indeks untuk setiap bidang yang terjadi dalam dokumen Anda. Anda tidak dapat mengunggah dokumen yang berisi bidang yang tidak dikenal. Namun, setiap dokumen tidak harus berisi semua bidang—dokumen dapat berisi subset bidang yang dikonfigurasi untuk domain.

Amazon CloudSearch mendukung jenis bidang indeks berikut:

  • date—berisi stempel waktu. Tanggal dan waktu ditentukan dalam UTC (Coordinated Universal Time) menurut IETF RFC3339:. yyyy-mm-ddTHH:mm:ss.SSSZ Di UTC, misalnya, 17:00 23 Agustus 1970 adalah:. 1970-08-23T17:00:00Z Perhatikan bahwa Anda juga dapat menentukan detik pecahan saat menentukan waktu di UTC. Misalnya, 1967-01-31T23:20:50.650Z.

  • date-array—bidang tanggal yang dapat berisi beberapa nilai.

  • double—berisi nilai floating point 64-bit presisi ganda.

  • double-array—bidang ganda yang dapat berisi beberapa nilai.

  • int—berisi nilai integer bertanda 64-bit.

  • int-array—sebuah bidang integer yang dapat berisi beberapa nilai.

  • latlon—berisi lokasi yang disimpan sebagai pasangan nilai lintang dan bujur (). lat, lon

  • literal—berisi pengenal atau data lain yang ingin Anda cocokkan dengan tepat. Bidang literal peka huruf besar/kecil.

  • literal-array—bidang literal yang dapat berisi beberapa nilai.

  • text—berisi data alfanumerik arbitrer.

  • text-array—bidang teks yang dapat berisi beberapa nilai.

Nama kolom indeks reguler harus dimulai dengan huruf dan setidaknya 3 dan panjangnya tidak lebih dari 64 karakter. Karakter yang diizinkan adalah: a-z (huruf kecil), 0-9, dan _ (garis bawah). Skor nama dicadangkan dan tidak dapat ditentukan sebagai nama bidang. Semua nama bidang dan ekspresi harus unik.

Nama bidang dinamis harus dimulai atau diakhiri dengan wildcard (*). String sebelum atau sesudah wildcard dapat berisi kumpulan karakter yang sama dengan bidang indeks biasa. Untuk informasi selengkapnya tentang bidang dinamis, lihatMenggunakan Bidang Dinamis di Amazon CloudSearch.

Opsi yang dapat Anda konfigurasikan untuk bidang bervariasi sesuai dengan jenis bidang:

  • HighlightEnabled—Anda bisa mendapatkan informasi penyorotan untuk klik pencarian di bidang HighlightEnabled teks apa pun. Berlaku untuk:text,text-array.

  • FacetEnabled—Anda bisa mendapatkan informasi aspek untuk bidang apa punFacetEnabled. Bidang teks tidak dapat digunakan untuk faset. Berlaku untuk: intint-array,date,,date-array,double,double-array,latlon,literal,literal-array.

  • ReturnEnabled—Anda dapat mengambil nilai ReturnEnabled bidang apa pun dengan hasil pencarian Anda. Perhatikan bahwa ini meningkatkan ukuran indeks Anda, yang dapat meningkatkan biaya menjalankan domain Anda. Jika memungkinkan, yang terbaik adalah mengambil sejumlah besar data dari sumber eksternal, daripada menyematkannya dalam indeks Anda. Karena perlu beberapa waktu untuk menerapkan pembaruan dokumen di seluruh domain, data penting seperti informasi harga harus diambil dari sumber eksternal menggunakan ID dokumen yang dikembalikan. Berlaku untuk:int,int-array,date,date-array,double,double-array,latlon,,literal,literal-array,text,text-array.

  • SearchEnabled—Anda dapat mencari isi SearchEnabled bidang apa pun. Bidang teks selalu dapat dicari. Berlaku untuk:int,int-array,date,date-array,double,double-array,latlon,,literal,literal-array,text,text-array.

  • SortEnabled—Anda dapat mengurutkan hasil pencarian menurut abjad atau numerik menggunakan bidang apa pun. SortEnabled Bidang tipe array tidak bisa. SortEnabled Hanya mengurutkan bidang numerik yang diaktifkan yang dapat digunakan dalam ekspresi. Berlaku untuk:int,date,latlon,double,literal,text.

Anda juga dapat menentukan nilai default dan sumber untuk bidang apa pun. Menentukan nilai default dapat menjadi penting jika Anda menggunakan bidang numerik dalam ekspresi dan bidang itu tidak ada di setiap dokumen. Menentukan sumber menyalin data dari satu bidang ke bidang lainnya, memungkinkan Anda untuk menggunakan data sumber yang sama dengan cara yang berbeda dengan mengonfigurasi opsi yang berbeda untuk bidang. Anda dapat menggunakan wildcard (*) saat menentukan nama sumber untuk menyalin data dari semua bidang yang cocok dengan pola yang ditentukan.

Ketika Anda menambahkan bidang atau memodifikasi bidang yang ada, Anda harus secara eksplisit mengeluarkan permintaan untuk mengindeks ulang data Anda ketika Anda selesai membuat perubahan konfigurasi. Untuk informasi selengkapnya, lihat rebuild the index.

penting

Jika Anda mengubah jenis bidang dan memiliki dokumen dalam indeks Anda yang berisi data yang tidak kompatibel dengan jenis bidang baru, semua bidang yang sedang diproses dimasukkan ke dalam FailedToValidate status saat Anda menjalankan pengindeksan dan operasi pengindeksan gagal. Mengembalikan perubahan konfigurasi yang tidak kompatibel akan memungkinkan Anda untuk berhasil membangun kembali indeks Anda. Jika perubahan diperlukan, Anda harus memperbarui atau menghapus dokumen yang tidak kompatibel dari indeks Anda untuk menggunakan konfigurasi baru.

Mengkonfigurasi Bidang Indeks Individu dengan AWS CLI

Anda menggunakan aws cloudsearch define-index-field perintah untuk mengonfigurasi kolom indeks individual untuk domain pencarian. Untuk informasi tentang menginstal dan menyiapkan AWS CLI, lihat AWS Command Line InterfacePanduan Pengguna.

Untuk menambahkan kolom indeks ke domain Anda
  • Jalankan aws cloudsearch define-index-field perintah dan tentukan nama bidang baru dengan --name opsi, dan jenis bidang dengan --type opsi. Contoh berikut menambahkan int bidang yang dipanggil year ke domain film.

    aws cloudsearch define-index-field --domain-name movies --name year --type int { "IndexField": { "Status": { "PendingDeletion": false, "State": "RequiresIndexDocuments", "CreationDate": "2014-06-25T23:03:06Z", "UpdateVersion": 15, "UpdateDate": "2014-06-25T23:03:06Z" }, "Options": { "IndexFieldType": "int", "IndexFieldName": "year" } } }
catatan

Ketika Anda menambahkan bidang atau memodifikasi bidang yang ada, Anda harus secara eksplisit mengeluarkan permintaan untuk mengindeks ulang data Anda ketika Anda selesai membuat perubahan konfigurasi. Untuk informasi selengkapnya, lihat rebuild the index.

Mengonfigurasi Bidang Indeks Menggunakan Konsol Amazon CloudSearch

Anda dapat dengan mudah configure individual index fields untuk domain Anda melalui panel Opsi Pengindeksan di CloudSearch konsol Amazon. Mengonfigurasi bidang indeks di konsol memerlukan DefineIndexFields tindakan, yang AWS CLI tidak didukung.

Mengonfigurasi Bidang Individu Menggunakan Konsol Amazon CloudSearch

Untuk mengkonfigurasi bidang indeks baru
  1. Buka CloudSearch konsol Amazon di https://console.aws.amazon.com/cloudsearch/home.

  2. Di panel navigasi kiri, pilih Domain.

  3. Klik nama domain yang ingin Anda konfigurasikan, lalu buka tab Opsi pengindeksan.

  4. Pilih Kolom indeks baru untuk menambahkan spesifikasi bidang ke daftar.

  5. Tentukan nama unik untuk bidang dan pilih jenis bidang. Nama bidang harus dimulai dengan huruf dan setidaknya 3 dan panjangnya tidak lebih dari 64 karakter. Karakter yang diizinkan adalah: a-z (huruf kecil), 0-9, dan _ (garis bawah). Skor nama dicadangkan dan tidak dapat digunakan sebagai nama bidang.

  6. Pilih detail kueri yang ingin Anda aktifkan untuk bidang tersebut. Untuk informasi selengkapnya, lihat configure indexing options.

  7. Pilih skema analisis yang akan digunakan untuk setiap bidang teks. Skema analisis menentukan opsi pemrosesan teks khusus bahasa yang digunakan selama pengindeksan. Secara default, bidang teks menggunakan skema _en_default_ analisis. Untuk informasi selengkapnya, lihat Mengkonfigurasi Skema Analisis.

  8. Tentukan nilai default untuk bidang (opsional). Nilai ini digunakan ketika tidak ada nilai yang ditentukan untuk bidang dalam data dokumen.

  9. Secara opsional, tambahkan bidang tambahan di bidang Sumber.

  10. Pilih Kirim.

catatan

Ketika Anda menambahkan bidang atau memodifikasi bidang yang ada, Anda harus secara eksplisit mengeluarkan permintaan untuk mengindeks ulang data Anda ketika Anda selesai membuat perubahan konfigurasi. Untuk informasi selengkapnya, lihat rebuild the index.

Mengonfigurasi Bidang CloudSearch Indeks Amazon Menggunakan AWS SDK

AWS SDK (kecuali SDK Android dan iOS) mendukung semua CloudSearch tindakan Amazon yang ditentukan dalam API CloudSearch Konfigurasi Amazon, termasuk. DefineIndexField Untuk informasi selengkapnya tentang menginstal dan menggunakan AWS SDK, lihat AWS Software Development Kits.