

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Connect ke Microsoft SharePoint untuk basis pengetahuan Anda
<a name="sharepoint-data-source-connector"></a>

Microsoft SharePoint adalah layanan berbasis web kolaboratif untuk mengerjakan dokumen, halaman web, situs web, daftar, dan lainnya. Anda dapat menyambung ke SharePoint instans untuk basis pengetahuan Amazon Bedrock dengan menggunakan [AWS Management Console untuk Amazon Bedrock](https://console.aws.amazon.com/bedrock/home) atau [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)API (lihat Amazon Bedrock [didukung SDKs ](https://docs.aws.amazon.com/bedrock/latest/APIReference/welcome.html) dan). AWS CLI

**catatan**  
SharePoint konektor sumber data dalam rilis pratinjau dan dapat berubah.  
Sumber SharePoint data Microsoft tidak mendukung data multimodal, seperti tabel, bagan, diagram, atau gambar lainnya.

Amazon Bedrock mendukung koneksi ke instans SharePoint Online. Merayapi OneNote dokumen saat ini tidak didukung. Saat ini, hanya penyimpanan vektor Amazon OpenSearch Tanpa Server yang tersedia untuk digunakan dengan sumber data ini.

Ada batasan berapa banyak file dan MB per file yang dapat dirayapi. Lihat [Kuota untuk basis pengetahuan](https://docs.aws.amazon.com/bedrock/latest/userguide/quotas.html).

**Topics**
+ [Fitur yang didukung](#supported-features-sharepoint-connector)
+ [Prasyarat](#prerequisites-sharepoint-connector)
+ [Konfigurasi koneksi](#configuration-sharepoint-connector)

## Fitur yang didukung
<a name="supported-features-sharepoint-connector"></a>
+ Deteksi otomatis bidang dokumen utama
+ Filter konten inklusi/pengecualian
+ Konten tambahan disinkronkan untuk konten yang ditambahkan, diperbarui, dihapus
+ SharePoint Autentikasi App-Only

## Prasyarat
<a name="prerequisites-sharepoint-connector"></a>

### SharePoint (Online)
<a name="prerequisites-sharepoint-connector-online"></a>

**Di SharePoint (Online) Anda, selesaikan langkah-langkah berikut untuk menggunakan otentikasi SharePoint App-Only:**
+ Catat URL situs SharePoint online Anda/URLs. Misalnya, {{https://yourdomain.sharepoint.com/sites/mysite}}. URL Anda harus dimulai dengan {{https}} dan berisi{{sharepoint.com}}. URL situs Anda harus SharePoint situs yang sebenarnya, bukan {{sharepoint.com/}} atau {{sites/mysite/home.aspx}}
+ Catat nama domain URL instans SharePoint Online Anda/URLs.
+ Salin ID penyewa Microsoft 365 Anda. Anda dapat menemukan ID penyewa Anda di Properti portal Microsoft Entra Anda. Untuk detailnya, lihat [Menemukan ID penyewa Microsoft 365 Anda](https://learn.microsoft.com/en-us/sharepoint/find-your-office-365-tenant-id).
**catatan**  
Untuk contoh aplikasi, lihat [Mendaftarkan aplikasi klien di Microsoft Entra ID](https://learn.microsoft.com/en-us/azure/healthcare-apis/register-application) (sebelumnya dikenal sebagai Azure Active Directory) di situs web Microsoft Learn. 
+ Konfigurasikan SharePoint kredenal Khusus Aplikasi.
+ Salin ID klien dan nilai rahasia klien saat memberikan izin ke SharePoint App-Only. Untuk informasi selengkapnya, lihat [Memberikan akses menggunakan Hanya SharePoint Aplikasi](https://learn.microsoft.com/en-us/sharepoint/dev/solution-guidance/security-apponly-azureacs).
**catatan**  
Anda tidak perlu menyiapkan izin API apa pun untuk SharePoint App-Only. Namun, Anda harus mengonfigurasi izin APP di SharePoint samping. Untuk informasi selengkapnya tentang izin APP yang diperlukan, lihat dokumentasi Microsoft tentang [Pemberian akses menggunakan SharePoint ](https://learn.microsoft.com/en-us/sharepoint/dev/solution-guidance/security-apponly-azureacs) Hanya Aplikasi.

### Akun AWS
<a name="prerequisites-sharepoint-connector-account"></a>

**Di AWS akun Anda, pastikan Anda**:
+ Simpan kredensyal otentikasi Anda secara [AWS Secrets Manager rahasia dan catat](https://docs.aws.amazon.com/secretsmanager/latest/userguide/create_secret.html) Nama Sumber Daya Amazon (ARN) rahasianya. Ikuti petunjuk **konfigurasi Koneksi** di halaman ini untuk menyertakan pasangan nilai kunci yang harus disertakan dalam rahasia Anda.
+ Sertakan izin yang diperlukan untuk terhubung ke sumber data Anda dalam role/permissions kebijakan AWS Identity and Access Management (IAM) untuk basis pengetahuan Anda. Untuk informasi tentang izin yang diperlukan untuk sumber data ini untuk ditambahkan ke IAM peran basis pengetahuan Anda, lihat [Izin untuk mengakses sumber data](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-permissions.html#kb-permissions-access-ds).

**catatan**  
Jika Anda menggunakan konsol, Anda dapat pergi ke AWS Secrets Manager untuk menambahkan rahasia Anda atau menggunakan rahasia yang ada sebagai bagian dari langkah konfigurasi sumber data. IAM Peran dengan semua izin yang diperlukan dapat dibuat untuk Anda sebagai bagian dari langkah konsol untuk membuat basis pengetahuan. Setelah Anda mengonfigurasi sumber data dan konfigurasi lainnya, IAM peran dengan semua izin yang diperlukan diterapkan ke basis pengetahuan khusus Anda.  
Kami menyarankan Anda secara teratur menyegarkan atau memutar kredensyal dan rahasia Anda. Berikan hanya tingkat akses yang diperlukan untuk keamanan Anda sendiri. Kami tidak menyarankan Anda menggunakan kembali kredensyal dan rahasia di seluruh sumber data.

## Konfigurasi koneksi
<a name="configuration-sharepoint-connector"></a>

Untuk menyambung ke SharePoint instans, Anda harus memberikan informasi konfigurasi yang diperlukan agar Amazon Bedrock dapat mengakses dan meng-crawl data Anda. Anda juga harus mengikuti[Prasyarat](#prerequisites-sharepoint-connector).

Contoh konfigurasi untuk sumber data ini disertakan dalam bagian ini.

Untuk informasi selengkapnya tentang deteksi otomatis bidang dokumen, filter inklusi/pengecualian, sinkronisasi inkremental, kredensi otentikasi rahasia, dan cara kerjanya, pilih yang berikut ini:

### Deteksi otomatis bidang dokumen utama
<a name="ds-sharepoint-document-fields"></a>

Konektor sumber data secara otomatis mendeteksi dan merayapi semua bidang metadata utama dokumen atau konten Anda. Misalnya, konektor sumber data dapat merayapi badan dokumen yang setara dengan dokumen Anda, judul dokumen, tanggal pembuatan atau modifikasi dokumen, atau bidang inti lainnya yang mungkin berlaku untuk dokumen Anda.

**penting**  
Jika konten Anda menyertakan informasi sensitif, maka Amazon Bedrock dapat merespons menggunakan informasi sensitif.

Anda dapat menerapkan operator pemfilteran ke bidang metadata untuk membantu Anda lebih meningkatkan relevansi tanggapan. Misalnya, dokumentasikan “epoch\_modification\_time” atau jumlah detik yang berlalu 1 Januari 1970 untuk saat dokumen terakhir diperbarui. *Anda dapat memfilter data terbaru, di mana “epoch\_modification\_time” lebih besar dari angka tertentu.* Untuk informasi selengkapnya tentang operator pemfilteran yang dapat Anda terapkan ke bidang metadata, lihat [Metadata](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-test-config.html) dan pemfilteran.

### Filter inklusi/pengecualian
<a name="ds-sharepoint-inclusion-exclusion"></a>

Anda dapat menyertakan atau mengecualikan perayapan konten tertentu. Misalnya, Anda dapat menentukan pola prefix/regular ekspresi pengecualian untuk melewatkan perayapan file apa pun yang berisi “pribadi” dalam nama file. Anda juga dapat menentukan pola prefix/regular ekspresi inklusi untuk menyertakan entitas konten atau jenis konten tertentu. Jika Anda menentukan filter penyertaan dan pengecualian dan keduanya cocok dengan dokumen, filter pengecualian akan diutamakan dan dokumen tidak dirayapi.

Contoh pola ekspresi reguler untuk mengecualikan atau memfilter file PDF yang berisi “pribadi” dalam nama file:*”. \*pribadi.\*\\\\ .pdf*”

Anda dapat menerapkan inclusion/exclusion filter pada jenis konten berikut:
+ `Page`: Judul halaman utama
+ `Event`: Nama acara
+ `File`: Nama file dengan ekstensi untuk lampiran dan semua file dokumen

Merayapi OneNote dokumen saat ini tidak didukung.

### Sinkronisasi inkremental
<a name="ds-sharepoint-incremental-sync"></a>

Konektor sumber data merayapi konten baru, dimodifikasi, dan dihapus setiap kali sumber data Anda disinkronkan dengan basis pengetahuan Anda. Amazon Bedrock dapat menggunakan mekanisme sumber data Anda untuk melacak perubahan konten dan merayapi konten yang berubah sejak sinkronisasi terakhir. Saat Anda menyinkronkan sumber data dengan basis pengetahuan untuk pertama kalinya, semua konten dirayapi secara default.

Untuk menyinkronkan sumber data Anda dengan basis pengetahuan Anda, gunakan [StartIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StartIngestionJob.html)API atau pilih basis pengetahuan Anda di konsol dan pilih **Sinkronkan** dalam bagian ikhtisar sumber data.

**penting**  
Semua data yang Anda sinkronkan dari sumber data Anda akan tersedia bagi siapa saja yang memiliki `bedrock:Retrieve` izin untuk mengambil data. Ini juga dapat mencakup data apa pun dengan izin sumber data terkontrol. Untuk informasi selengkapnya, lihat [Izin basis pengetahuan](https://docs.aws.amazon.com/bedrock/latest/userguide/kb-permissions.html).

### Kredensial otentikasi rahasia
<a name="ds-sharepoint-secret-auth-credentials"></a>

Saat menggunakan otentikasi SharePoint App-Only, kredensyal autentikasi rahasia Anda harus menyertakan pasangan nilai kunci ini: AWS Secrets Manager 
+ `clientId`: {{client ID associated with your Microsoft Entra SharePoint application}}
+ `clientSecret`: {{client secret associated with your Microsoft Entra SharePoint application}}
+ `sharePointClientId`: {{client ID generated when registering your SharePoint app for App-Only authentication}}
+ `sharePointClientSecret`: {{client secret generated when registering your SharePoint app for App-Only authentication}}

**catatan**  
Rahasia Anda AWS Secrets Manager harus menggunakan Wilayah yang sama dari basis pengetahuan Anda.

------
#### [ Console ]

**Hubungkan SharePoint instans ke basis pengetahuan Anda**<a name="connect-sharepoint-console"></a>

1. Ikuti langkah-langkah di [Buat basis pengetahuan dengan menghubungkan ke sumber data di Amazon Bedrock Knowledge Bases](knowledge-base-create.md) dan pilih **SharePoint**sebagai sumber data.

1. Berikan nama dan deskripsi opsional untuk sumber data.

1. Berikan URL SharePoint situs Anda/URLs. Misalnya, untuk SharePoint Online,{{https://yourdomain.sharepoint.com/sites/mysite}}. URL Anda harus dimulai dengan {{https}} dan berisi{{sharepoint.com}}. URL situs Anda harus SharePoint situs yang sebenarnya, bukan {{sharepoint.com/}} atau {{sites/mysite/home.aspx}}

1. Berikan nama domain SharePoint instance Anda.

1. Di bagian **Pengaturan lanjutan**, Anda dapat secara opsional mengonfigurasi yang berikut:
   + **Kunci KMS untuk penyimpanan data sementara.** — Anda dapat mengenkripsi data sementara sambil mengubah data Anda menjadi embeddings dengan default atau kunci KMS Anda sendiri. Kunci yang dikelola AWS Untuk informasi selengkapnya, lihat [Enkripsi penyimpanan data sementara selama konsumsi data](encryption-kb.md#encryption-kb-ingestion).
   + **Kebijakan penghapusan data** — Anda dapat menghapus embeddings vektor untuk sumber data Anda yang disimpan di penyimpanan vektor secara default, atau memilih untuk menyimpan data penyimpanan vektor.

1. Berikan informasi otentikasi untuk terhubung ke SharePoint instans Anda. Untuk otentikasi SharePoint App-Only:

   1. Berikan ID penyewa. Anda dapat menemukan ID penyewa Anda di Properti portal Azure Active Directory Anda.

   1. Buka AWS Secrets Manager untuk menambahkan kredensyal rahasia Anda atau gunakan Nama Sumber Daya Amazon (ARN) yang ada untuk rahasia yang Anda buat. Rahasia Anda harus berisi ID SharePoint klien dan rahasia SharePoint klien yang dihasilkan saat Anda mendaftarkan App-Only di tingkat penyewa atau tingkat situs, dan ID klien Entra dan rahasia klien Entra yang dihasilkan saat Anda mendaftarkan aplikasi di Entra.

1. (Opsional) Di bagian **Parsing dan chunking konten**, Anda dapat menyesuaikan cara mengurai dan memotong data Anda. Lihat sumber daya berikut untuk mempelajari lebih lanjut tentang penyesuaian ini:
   + Untuk informasi selengkapnya tentang opsi penguraian, lihat[Opsi penguraian untuk sumber data Anda](kb-advanced-parsing.md).
   + Untuk informasi lebih lanjut tentang strategi chunking, lihat. [Bagaimana content chunking bekerja untuk basis pengetahuan](kb-chunking.md)
**Awas**  
Anda tidak dapat mengubah strategi chunking setelah terhubung ke sumber data.
   + Untuk informasi selengkapnya tentang cara menyesuaikan potongan data dan pemrosesan metadata Anda dengan fungsi Lambda, lihat. [Gunakan fungsi Lambda transformasi kustom untuk menentukan bagaimana data Anda dicerna](kb-custom-transformation.md)

1. Pilih untuk menggunakan pola filters/regular ekspresi untuk menyertakan atau mengecualikan konten tertentu. Semua konten standar dirayapi sebaliknya.

1. Lanjutkan untuk memilih model embeddings dan penyimpanan vektor. Untuk melihat langkah-langkah yang tersisa, kembali ke [Buat basis pengetahuan dengan menghubungkan ke sumber data di Amazon Bedrock Knowledge Bases](knowledge-base-create.md) dan lanjutkan dari langkah setelah menghubungkan sumber data Anda.

------
#### [ API ]

Berikut ini adalah contoh konfigurasi untuk menghubungkan ke SharePoint Online untuk basis pengetahuan Amazon Bedrock Anda. Anda mengonfigurasi sumber data menggunakan API dengan AWS CLI atau SDK yang didukung, seperti Python. Setelah menelepon [CreateKnowledgeBase](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateKnowledgeBase.html), Anda menelepon [CreateDataSource](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateDataSource.html)untuk membuat sumber data dengan informasi koneksi Anda di`dataSourceConfiguration`.

Untuk mempelajari tentang penyesuaian yang dapat Anda terapkan pada konsumsi dengan menyertakan bidang opsional`vectorIngestionConfiguration`, lihat. [Sesuaikan konsumsi untuk sumber data](kb-data-source-customize-ingestion.md)

**AWS Command Line Interface**

```
aws bedrock-agent create-data-source \
 --name "SharePoint Online connector" \
 --description "SharePoint Online data source connector for Amazon Bedrock to use content in SharePoint" \
 --knowledge-base-id "your-knowledge-base-id" \
 --data-source-configuration file://sharepoint-bedrock-connector-configuration.json \
 --data-deletion-policy "DELETE"
```

**Isi dari `sharepoint-bedrock-connector-configuration.json`**

```
{
    "sharePointConfiguration": {
        "sourceConfiguration": {
            "tenantId": "888d0b57-69f1-4fb8-957f-e1f0bedf64de",
            "hostType": "ONLINE",
            "domain": "yourdomain",
            "siteUrls": [
                "https://yourdomain.sharepoint.com/sites/mysite"
            ],
            "authType": "OAUTH2_SHAREPOINT_APP_ONLY_CLIENT_CREDENTIALS",
            "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-SharePoint"
        },
        "crawlerConfiguration": {
            "filterConfiguration": {
                "type": "PATTERN",
                "patternObjectFilter": {
                    "filters": [
                        {
                            "objectType": "File",
                            "inclusionFilters": [
                                ".*\\.pdf"
                            ],
                            "exclusionFilters": [
                                ".*private.*\\.pdf"
                            ]
                        }
                    ]
                }
            }
        }
    },
    "type": "SHAREPOINT"
}
```

------

**penting**  
Otentikasi OAuth2 .0 tidak disarankan. Kami menyarankan Anda menggunakan otentikasi SharePoint App-Only.

## Menggunakan OAuth2 .0
<a name="sharepoint-connector-oauth"></a>

Menggunakan OAuth 2.0, Anda dapat mengautentikasi dan mengotorisasi akses ke SharePoint sumber daya untuk SharePoint konektor yang terintegrasi dengan Basis Pengetahuan.

### Prasyarat
<a name="sharepoint-connector-oauth-prereq"></a>

**Dalam SharePoint, untuk otentikasi OAuth 2.0, pastikan Anda**:
+ Catat URL situs SharePoint online Anda/URLs. Misalnya, {{https://yourdomain.sharepoint.com/sites/mysite}}. URL Anda harus dimulai dengan {{https}} dan berisi{{sharepoint.com}}. URL situs Anda harus SharePoint situs yang sebenarnya, bukan {{sharepoint.com/}} atau {{sites/mysite/home.aspx}}
+ Catat nama domain URL instans SharePoint Online Anda/URLs.
+ Salin ID penyewa Microsoft 365 Anda. Anda dapat menemukan ID penyewa Anda di Properti portal Microsoft Entra Anda atau di aplikasi Anda OAuth.

  Catat nama pengguna dan kata sandi SharePoint akun admin, dan salin ID klien dan nilai rahasia klien saat mendaftarkan aplikasi.
**catatan**  
Untuk contoh aplikasi, lihat [Mendaftarkan aplikasi klien di Microsoft Entra ID](https://learn.microsoft.com/en-us/azure/healthcare-apis/register-application) (sebelumnya dikenal sebagai Azure Active Directory) di situs web Microsoft Learn. 
+ Izin baca tertentu diperlukan untuk terhubung SharePoint saat Anda mendaftarkan aplikasi.
  + SharePoint: AllSites .Read (Delegated) - Baca item di semua koleksi situs
+ Anda mungkin perlu menonaktifkan **Default Keamanan** di portal Azure menggunakan pengguna admin. Untuk informasi selengkapnya tentang mengelola setelan default keamanan di portal Azure, lihat [dokumentasi Microsoft tentang cara mengamankan enable/disable default](https://learn.microsoft.com/en-us/microsoft-365/business-premium/m365bp-conditional-access?view=o365-worldwide&tabs=secdefaults#security-defaults-1).
+ Anda mungkin perlu menonaktifkan otentikasi multi-faktor (MFA) di SharePoint akun Anda, sehingga Amazon Bedrock tidak diblokir untuk merayapi konten Anda. SharePoint 

Untuk menyelesaikan prasyarat, pastikan Anda telah menyelesaikan langkah-langkahnya. [Akun AWS](#prerequisites-sharepoint-connector-account)

### Kredensial otentikasi rahasia
<a name="sharepoint-secret-auth-credentials-oauth"></a>

Untuk konfigurasi koneksi untuk OAuth2 .0, Anda dapat melakukan langkah yang sama untuk deteksi otomatis bidang dokumen utama, inclusion/exclusion filter, dan sinkronisasi inkremental seperti yang dijelaskan dalam. [Konfigurasi koneksi](#configuration-sharepoint-connector)

**Untuk otentikasi OAuth 2.0, kredensi otentikasi rahasia Anda AWS Secrets Manager harus menyertakan pasangan nilai** kunci ini.
+ `username`: {{SharePoint admin username}}
+ `password`: {{SharePoint admin password}}
+ `clientId`: {{OAuth app client ID}}
+ `clientSecret`: {{OAuth app client secret}}

### Hubungkan SharePoint instans ke basis pengetahuan Anda
<a name="sharepoint-connector-oauth-using"></a>

Untuk menghubungkan SharePoint instance ke basis pengetahuan Anda saat menggunakan OAuth2 .0:
+ (konsol) Di konsol, ikuti langkah yang sama seperti yang dijelaskan di [Connect SharePoint instance ke basis pengetahuan Anda](https://docs.aws.amazon.com/bedrock/latest/userguide/sharepoint-data-source-connector.html#connect-sharepoint-console). Bila Anda ingin memberikan informasi otentikasi untuk terhubung ke SharePoint instans Anda.
  + Berikan ID penyewa. Anda dapat menemukan ID penyewa Anda di Properti portal Azure Active Directory Anda.
  + Buka AWS Secrets Manager untuk menambahkan kredensyal otentikasi rahasia Anda atau gunakan Nama Sumber Daya Amazon (ARN) yang ada untuk rahasia yang Anda buat. Rahasia Anda harus berisi nama pengguna dan kata sandi SharePoint admin, serta ID klien aplikasi dan rahasia klien terdaftar Anda. Untuk contoh aplikasi, lihat [Mendaftarkan aplikasi klien di Microsoft Entra ID](https://learn.microsoft.com/en-us/azure/healthcare-apis/register-application) (sebelumnya dikenal sebagai Azure Active Directory) di situs web Microsoft Learn.
+ (API) Berikut ini adalah contoh penggunaan `CreateDataSource` API untuk membuat sumber data Anda dengan informasi koneksi Anda untuk OAuth2 .0.

  ```
  aws bedrock-agent create-data-source \
   --name "SharePoint Online connector" \
   --description "SharePoint Online data source connector for Amazon Bedrock to use content in SharePoint" \
   --knowledge-base-id "your-knowledge-base-id" \
   --data-source-configuration file://sharepoint-bedrock-connector-configuration.json \
   --data-deletion-policy "DELETE"
  ```

  **Isi dari `sharepoint-bedrock-connector-configuration.json`**

  ```
  {
      "sharePointConfiguration": {
          "sourceConfiguration": {
              "tenantId": "888d0b57-69f1-4fb8-957f-e1f0bedf64de",
              "hostType": "ONLINE",
              "domain": "yourdomain",
              "siteUrls": [
                  "https://yourdomain.sharepoint.com/sites/mysite"
              ],
              "authType": "OAUTH2_CLIENT_CREDENTIALS",
              "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-SharePoint"
          },
          "crawlerConfiguration": {
              "filterConfiguration": {
                  "type": "PATTERN",
                  "patternObjectFilter": {
                      "filters": [
                          {
                              "objectType": "File",
                              "inclusionFilters": [
                                  ".*\\.pdf"
                              ],
                              "exclusionFilters": [
                                  ".*private.*\\.pdf"
                              ]
                          }
                      ]
                  }
              }
          }
      },
      "type": "SHAREPOINT"
  }
  ```