Dropbox - Amazon Kendra

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Dropbox

Dropbox adalah layanan hosting file yang menawarkan penyimpanan cloud, organisasi dokumen, dan layanan template dokumen. Jika Anda pengguna Dropbox, Anda dapat menggunakannya Amazon Kendra untuk mengindeks file Dropbox, Dropbox Paper, Template Dropbox Paper, dan pintasan tersimpan ke halaman web. Anda juga dapat mengonfigurasi Amazon Kendra untuk mengindeks file Dropbox tertentu, Dropbox Paper, Template Dropbox Paper, dan pintasan tersimpan ke halaman web.

Amazon Kendra mendukung Dropbox dan Dropbox Advanced untuk Dropbox Business.

Anda dapat terhubung Amazon Kendra ke sumber data Dropbox menggunakan Amazon Kendra konsol dan TemplateConfigurationAPI.

Untuk mengatasi masalah konektor sumber data Amazon Kendra Dropbox Anda, lihat. Mengatasi masalah sumber data

Fitur yang didukung

Amazon Kendra Konektor sumber data Dropbox mendukung fitur-fitur berikut:

  • Pemetaan lapangan

  • Kontrol akses pengguna

  • Filter inklusi/pengecualian

  • Sinkronisasi konten penuh dan tambahan

  • Cloud privat virtual (VPC)

Prasyarat

Sebelum dapat digunakan Amazon Kendra untuk mengindeks sumber data Dropbox Anda, lakukan perubahan ini di Dropbox dan AWS akun Anda.

Di Dropbox, pastikan Anda memiliki:

  • Membuat akun Dropbox Advanced dan menyiapkan pengguna admin.

  • Mengonfigurasi aplikasi Dropbox dengan nama Aplikasi unik, mengaktifkan Scoped Access. Lihat dokumentasi Dropbox tentang membuat aplikasi.

  • Aktifkan izin Dropbox Lengkap di konsol Dropbox dan menambahkan izin berikut:

    • file.content.read

    • files.metadata.read

    • berbagi.baca

    • file_requests.read

    • kelompok.baca

    • team_info.read

    • team_data.content.read

  • Mencatat kunci aplikasi Dropbox Anda, rahasia aplikasi Dropbox, dan token akses Dropbox untuk kredensi otentikasi dasar.

    catatan

    Kami menyarankan Anda secara teratur menyegarkan atau memutar kredensil dan rahasia Anda. Berikan hanya tingkat akses yang diperlukan untuk keamanan Anda sendiri. Kami tidak menyarankan Anda menggunakan kembali kredensil dan rahasia di seluruh sumber data, dan konektor versi 1.0 dan 2.0 (jika berlaku).

  • Mengonfigurasi dan menyalin token akses Oauth 2.0 sementara untuk aplikasi Dropbox Anda. Token ini bersifat sementara dan kedaluwarsa setelah 4 jam. Lihat dokumentasi Dropbox tentang otentikasi OAuth.

    catatan

    Anda disarankan untuk membuat token akses penyegaran Dropbox yang tidak pernah kedaluwarsa, alih-alih mengandalkan token akses satu kali yang kedaluwarsa setelah 4 jam. Token akses penyegaran bersifat permanen dan tidak pernah kedaluwarsa sehingga Anda dapat terus menyinkronkan sumber data Anda di masa mendatang.

  • Direkomendasikan: Mengonfigurasi token penyegaran permanen Dropbox yang tidak pernah kedaluwarsa untuk memungkinkan Amazon Kendra untuk terus menyinkronkan sumber data Anda tanpa gangguan apa pun. Lihat dokumentasi Dropbox tentang token penyegaran.

  • Memeriksa setiap dokumen unik di Dropbox dan di seluruh sumber data lain yang Anda rencanakan untuk digunakan untuk indeks yang sama. Setiap sumber data yang ingin Anda gunakan untuk indeks tidak boleh berisi dokumen yang sama di seluruh sumber data. ID dokumen bersifat global untuk indeks dan harus unik per indeks.

Di dalam Anda Akun AWS, pastikan Anda memiliki:

  • Membuat Amazon Kendra indeks dan, jika menggunakan API, mencatat ID indeks.

  • Membuat IAM peran untuk sumber data Anda dan, jika menggunakan API, catat ARN peran tersebut IAM .

    catatan

    Jika Anda mengubah jenis otentikasi dan kredensialnya, Anda harus memperbarui IAM peran Anda untuk mengakses ID rahasia yang benar AWS Secrets Manager .

  • Menyimpan kredensi otentikasi Dropbox Anda secara AWS Secrets Manager rahasia dan, jika menggunakan API, catat ARN rahasianya.

    catatan

    Kami menyarankan Anda secara teratur menyegarkan atau memutar kredensil dan rahasia Anda. Berikan hanya tingkat akses yang diperlukan untuk keamanan Anda sendiri. Kami tidak menyarankan Anda menggunakan kembali kredensil dan rahasia di seluruh sumber data, dan konektor versi 1.0 dan 2.0 (jika berlaku).

Jika Anda tidak memiliki IAM peran atau rahasia yang ada, Anda dapat menggunakan konsol untuk membuat IAM peran dan Secrets Manager rahasia baru saat menghubungkan sumber data Dropbox Anda. Amazon Kendra Jika Anda menggunakan API, Anda harus memberikan ARN IAM peran dan Secrets Manager rahasia yang ada, dan ID indeks.

Instruksi koneksi

Untuk terhubung Amazon Kendra ke sumber data Dropbox Anda, Anda harus memberikan rincian yang diperlukan dari sumber data Dropbox Anda sehingga Amazon Kendra dapat mengakses data Anda. Jika Anda belum mengonfigurasi Dropbox Amazon Kendra, lihatPrasyarat.

Console

Untuk terhubung Amazon Kendra ke Dropbox

  1. Masuk ke AWS Management Console dan buka Amazon Kendra konsol.

  2. Dari panel navigasi kiri, pilih Indeks dan kemudian pilih indeks yang ingin Anda gunakan dari daftar indeks.

    catatan

    Anda dapat memilih untuk mengonfigurasi atau mengedit pengaturan kontrol akses Pengguna di bawah Pengaturan indeks.

  3. Pada halaman Memulai, pilih Tambahkan sumber data.

  4. Pada halaman Tambah sumber data, pilih konektor Dropbox, lalu pilih Tambah konektor. Jika menggunakan versi 2 (jika ada), pilih konektor Dropbox dengan tag “V2.0".

  5. Pada halaman Tentukan detail sumber data, masukkan informasi berikut:

    1. Di Nama dan deskripsi, untuk Nama sumber data —Masukkan nama untuk sumber data Anda. Anda dapat memasukkan tanda hubung tetapi bukan spasi.

    2. (Opsional) Deskripsi —Masukkan deskripsi opsional untuk sumber data Anda.

    3. Dalam Bahasa default —Pilih bahasa untuk memfilter dokumen Anda untuk indeks. Kecuali Anda menentukan sebaliknya, bahasa default ke bahasa Inggris. Bahasa yang ditentukan dalam metadata dokumen menggantikan bahasa yang dipilih.

    4. Di Tag, untuk Tambahkan tag baru —Sertakan tag opsional untuk mencari dan memfilter sumber daya Anda atau melacak AWS biaya Anda.

    5. Pilih Selanjutnya.

  6. Pada halaman Tentukan akses dan keamanan, masukkan informasi berikut:

    1. Otorisasi — Aktifkan atau nonaktifkan informasi daftar kontrol akses (ACL) untuk dokumen Anda, jika Anda memiliki ACL dan ingin menggunakannya untuk kontrol akses. ACL menentukan dokumen mana yang dapat diakses pengguna dan grup. Informasi ACL digunakan untuk memfilter hasil pencarian berdasarkan pengguna atau akses grup mereka ke dokumen. Untuk informasi selengkapnya, lihat Pemfilteran konteks pengguna.

    2. Jenis token otentikasi —Pilih token permanen (disarankan) atau token akses sementara.

    3. AWS Secrets Manager rahasia —Pilih rahasia yang ada atau buat Secrets Manager rahasia baru untuk menyimpan kredensi otentikasi Dropbox Anda. Jika Anda memilih untuk membuat rahasia baru, jendela AWS Secrets Manager rahasia terbuka.

      1. Masukkan informasi berikut di jendela Buat AWS Secrets Manager rahasia:

        1. Nama rahasia —Nama untuk rahasiamu. Awalan 'AmazonKendra-Dropbox-' secara otomatis ditambahkan ke nama rahasia Anda.

        2. Untuk kunci Aplikasi, Rahasia aplikasi, dan informasi token (permanen atau sementara) —Masukkan nilai kredensi otentikasi yang dikonfigurasi di Dropbox.

      2. Simpan dan tambahkan rahasia Anda.

    4. Virtual Private Cloud (VPC) —Anda dapat memilih untuk menggunakan VPC. Jika demikian, Anda harus menambahkan Subnet dan grup keamanan VPC.

    5. Perayap identitas —Tentukan apakah akan mengaktifkan crawler Amazon Kendra identitas. Perayap identitas menggunakan informasi daftar kontrol akses (ACL) untuk dokumen Anda untuk memfilter hasil penelusuran berdasarkan akses pengguna atau grup mereka ke dokumen. Jika Anda memiliki ACL untuk dokumen Anda dan memilih untuk menggunakan ACL Anda, Anda juga dapat memilih untuk mengaktifkan crawler Amazon Kendra identitas untuk mengonfigurasi pemfilteran konteks pengguna dari hasil pencarian. Jika tidak, jika crawler identitas dimatikan, semua dokumen dapat dicari secara publik. Jika Anda ingin menggunakan kontrol akses untuk dokumen dan crawler identitas dimatikan, Anda dapat menggunakan PutPrincipalMappingAPI untuk mengunggah informasi akses pengguna dan grup untuk pemfilteran konteks pengguna.

    6. IAM peran —Pilih peran yang ada atau buat IAM IAM peran baru untuk mengakses kredensi repositori dan mengindeks konten.

      catatan

      IAM peran yang digunakan untuk indeks tidak dapat digunakan untuk sumber data. Jika Anda tidak yakin apakah peran yang ada digunakan untuk indeks atau FAQ, pilih Buat peran baru untuk menghindari kesalahan.

    7. Pilih Selanjutnya.

  7. Pada halaman Konfigurasi pengaturan sinkronisasi, masukkan informasi berikut:

    1. Untuk Pilih entitas atau jenis konten —Pilih entitas Dropbox atau jenis konten yang ingin dirayapi.

    2. Dalam konfigurasi tambahan untuk pola Regex —Tambahkan pola ekspresi reguler untuk menyertakan atau mengecualikan file tertentu.

    3. Mode sinkronisasi —Pilih cara memperbarui indeks saat konten sumber data berubah. Saat Anda menyinkronkan sumber data Amazon Kendra untuk pertama kalinya, semua konten dirayapi dan diindeks secara default. Anda harus menjalankan sinkronisasi penuh data Anda jika sinkronisasi awal Anda gagal, bahkan jika Anda tidak memilih sinkronisasi penuh sebagai opsi mode sinkronisasi Anda.

      • Sinkronisasi penuh: Indeks baru semua konten, ganti konten yang ada setiap kali sumber data Anda disinkronkan dengan indeks Anda.

      • Sinkronisasi baru yang dimodifikasi: Indeks hanya konten baru dan yang dimodifikasi setiap kali sumber data Anda disinkronkan dengan indeks Anda. Amazon Kendra dapat menggunakan mekanisme sumber data Anda untuk melacak perubahan konten dan mengindeks konten yang berubah sejak sinkronisasi terakhir.

      • Sinkronisasi baru, dimodifikasi, dihapus: Indeks hanya konten baru, dimodifikasi, dan dihapus setiap kali sumber data Anda disinkronkan dengan indeks Anda. Amazon Kendra dapat menggunakan mekanisme sumber data Anda untuk melacak perubahan konten dan mengindeks konten yang berubah sejak sinkronisasi terakhir.

    4. Di Jadwal lari Sinkronisasi, untuk Frekuensi —Pilih seberapa sering menyinkronkan konten sumber data Anda dan memperbarui indeks Anda.

    5. Pilih Selanjutnya.

  8. Pada halaman Setel pemetaan bidang, masukkan informasi berikut:

    1. Templat file, Dropbox Paper, dan Dropbox Paper —Pilih dari bidang sumber data default Amazon Kendra yang dihasilkan yang ingin Anda petakan ke indeks Anda.

    2. Tambahkan bidang —Untuk menambahkan bidang sumber data kustom untuk membuat nama bidang indeks untuk dipetakan dan tipe data bidang.

    3. Pilih Selanjutnya.

  9. Pada halaman Tinjau dan buat, periksa apakah informasi yang Anda masukkan sudah benar dan kemudian pilih Tambahkan sumber data. Anda juga dapat memilih untuk mengedit informasi Anda dari halaman ini. Sumber data Anda akan muncul di halaman Sumber data setelah sumber data berhasil ditambahkan.

API

Untuk terhubung Amazon Kendra ke Dropbox

Anda harus menentukan JSON dari skema sumber data menggunakan API. TemplateConfiguration Anda harus memberikan informasi berikut ini:

  • Sumber data —Tentukan tipe sumber data seperti DROPBOX saat Anda menggunakan skema TemplateConfigurationJSON. Juga tentukan sumber data seperti TEMPLATE saat Anda memanggil CreateDataSourceAPI.

  • Mode sinkronisasi —Tentukan cara Amazon Kendra memperbarui indeks Anda saat konten sumber data Anda berubah. Saat Anda menyinkronkan sumber data Amazon Kendra untuk pertama kalinya, semua konten dirayapi dan diindeks secara default. Anda harus menjalankan sinkronisasi penuh data Anda jika sinkronisasi awal Anda gagal, bahkan jika Anda tidak memilih sinkronisasi penuh sebagai opsi mode sinkronisasi Anda. Anda dapat memilih antara:

    • FORCED_FULL_CRAWLuntuk mengindeks semua konten baru, mengganti konten yang ada setiap kali sumber data Anda disinkronkan dengan indeks Anda.

    • FULL_CRAWLuntuk mengindeks hanya konten baru, dimodifikasi, dan dihapus setiap kali sumber data Anda disinkronkan dengan indeks Anda. Amazon Kendra dapat menggunakan mekanisme sumber data Anda untuk melacak perubahan konten dan mengindeks konten yang berubah sejak sinkronisasi terakhir.

    • CHANGE_LOGuntuk mengindeks hanya konten baru dan yang dimodifikasi setiap kali sumber data Anda disinkronkan dengan indeks Anda. Amazon Kendra dapat menggunakan mekanisme sumber data Anda untuk melacak perubahan konten dan mengindeks konten yang berubah sejak sinkronisasi terakhir.

  • Jenis token akses —Tentukan apakah Anda ingin menggunakan token akses permanen atau sementara untuk AWS Secrets Manager rahasia Anda yang menyimpan krednetial otentikasi Anda.

    catatan

    Anda disarankan untuk membuat token akses penyegaran yang tidak pernah kedaluwarsa di Dropbox daripada mengandalkan token akses satu kali yang kedaluwarsa setelah 4 jam. Anda membuat aplikasi dan token akses refresh di konsol pengembang Dropbox dan menyediakan token akses dalam rahasia Anda.

  • Rahasia Nama Sumber Daya Amazon (ARN) —Berikan Nama Sumber Daya Amazon (ARN) Secrets Manager rahasia yang berisi kredensi otentikasi untuk akun Dropbox Anda. Rahasianya disimpan dalam struktur JSON dengan kunci berikut:

    { "appKey": "Dropbox app key", "appSecret": "Dropbox app secret", "accesstoken": "temporary access token or refresh access token" }
  • Perayap identitas —Tentukan apakah akan mengaktifkan crawler Amazon Kendra identitas. Perayap identitas menggunakan informasi daftar kontrol akses (ACL) untuk dokumen Anda untuk memfilter hasil penelusuran berdasarkan akses pengguna atau grup mereka ke dokumen. Jika Anda memiliki ACL untuk dokumen Anda dan memilih untuk menggunakan ACL Anda, Anda juga dapat memilih untuk mengaktifkan crawler Amazon Kendra identitas untuk mengonfigurasi pemfilteran konteks pengguna dari hasil pencarian. Jika tidak, jika crawler identitas dimatikan, semua dokumen dapat dicari secara publik. Jika Anda ingin menggunakan kontrol akses untuk dokumen dan crawler identitas dimatikan, Anda dapat menggunakan PutPrincipalMappingAPI untuk mengunggah informasi akses pengguna dan grup untuk pemfilteran konteks pengguna.

  • IAM peran —Tentukan RoleArn kapan Anda menelepon CreateDataSource untuk memberikan IAM peran dengan izin untuk mengakses Secrets Manager rahasia Anda dan memanggil API publik yang diperlukan untuk konektor Dropbox dan. Amazon Kendra Untuk informasi selengkapnya, lihat IAM peran untuk sumber data Dropbox.

Anda juga dapat menambahkan fitur opsional berikut:

  • Virtual Private Cloud (VPC) VpcConfiguration —Tentukan kapan Anda menelepon. CreateDataSource Untuk informasi selengkapnya, lihat Melakukan konfigurasi Amazon Kendra untuk menggunakan Amazon VPC.

  • Jenis dokumen/konten —Tentukan apakah akan merayapi file di Dropbox, dokumen Dropbox Paper, templat Dropbox Paper, dan pintasan halaman web yang disimpan di Dropbox Anda.

  • Filter inklusi dan pengecualian —Tentukan apakah akan menyertakan atau mengecualikan file tertentu.

    catatan

    Sebagian besar sumber data menggunakan pola ekspresi reguler, yang merupakan pola inklusi atau pengecualian yang disebut sebagai filter. Jika Anda menentukan filter inklusi, hanya konten yang cocok dengan filter inklusi yang diindeks. Dokumen apa pun yang tidak cocok dengan filter inklusi tidak diindeks. Jika Anda menentukan filter inklusi dan pengecualian, dokumen yang cocok dengan filter pengecualian tidak akan diindeks, meskipun sesuai dengan filter inklusi.

  • Daftar kontrol akses (ACL) —Tentukan apakah akan merayapi informasi ACL untuk dokumen Anda, jika Anda memiliki ACL dan ingin menggunakannya untuk kontrol akses. ACL menentukan dokumen mana yang dapat diakses pengguna dan grup. Informasi ACL digunakan untuk memfilter hasil pencarian berdasarkan pengguna atau akses grup mereka ke dokumen. Untuk informasi selengkapnya, lihat Pemfilteran konteks pengguna.

  • Pemetaan bidang —Pilih untuk memetakan bidang sumber data Dropbox Anda ke bidang indeks Anda. Amazon Kendra Untuk informasi lebih lanjut, lihat Memetakan bidang sumber data.

    catatan

    Bidang badan dokumen atau badan dokumen yang setara untuk dokumen Anda diperlukan Amazon Kendra untuk mencari dokumen Anda. Anda harus memetakan nama bidang badan dokumen Anda di sumber data Anda ke nama bidang indeks_document_body. Semua kolom lain bersifat opsional.

Untuk daftar kunci JSON penting lainnya yang harus dikonfigurasi, lihat Skema templat Dropbox.

Pelajari selengkapnya

Untuk mempelajari lebih lanjut tentang mengintegrasikan Amazon Kendra dengan sumber data Dropbox Anda, lihat: