選取您的 Cookie 偏好設定

我們使用提供自身網站和服務所需的基本 Cookie 和類似工具。我們使用效能 Cookie 收集匿名統計資料,以便了解客戶如何使用我們的網站並進行改進。基本 Cookie 無法停用,但可以按一下「自訂」或「拒絕」以拒絕效能 Cookie。

如果您同意,AWS 與經核准的第三方也會使用 Cookie 提供實用的網站功能、記住您的偏好設定,並顯示相關內容,包括相關廣告。若要接受或拒絕所有非必要 Cookie,請按一下「接受」或「拒絕」。若要進行更詳細的選擇,請按一下「自訂」。

立方體

焦點模式
立方體 - Amazon Kendra

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Box 是一種雲端儲存服務,可提供檔案託管功能。您可以使用 Amazon Kendra 為 Box 內容的內容編製索引,包括評論、任務和 Web 連結。

您可以使用 Amazon Kendra 主控台和 BoxConfiguration API Amazon Kendra 連線到您的 Box 資料來源。 BoxConfiguration

如需對 Amazon Kendra Box 資料來源連接器進行故障診斷,請參閱 對資料來源進行故障診斷

支援的功能

Amazon Kendra Box 資料來源連接器支援下列功能:

  • 欄位映射

  • 使用者存取控制

  • 包含/排除篩選條件

  • 變更日誌、完整和增量內容同步

  • 虛擬私有雲端 (VPC)

先決條件

在您可以使用 Amazon Kendra 為 Box 資料來源編製索引之前,請在 Box 和 AWS 帳戶中進行這些變更。

在 Box 中,請確定您有:

  • Box Enterprise 或 Box Enterprise Plus 帳戶。

  • 在 Box Developer Console 中設定了 Box 自訂應用程式,並使用 JSON Web Token (JWT) 進行伺服器端身分驗證。如需詳細資訊,請參閱建立自訂應用程式設定 JWT 身分驗證的 Box 文件

  • 將您的應用程式存取層級設定為應用程式 + 企業存取,並允許其使用即使用者標頭進行 API 呼叫

  • 使用管理員使用者在您的 Box 應用程式中新增下列應用程式範圍

    • 寫入存放在 Box 中的所有檔案和資料夾

    • 管理使用者

    • 管理群組

    • 管理企業屬性

  • 已設定的公有/私有金鑰對,包括用戶端 ID、用戶端秘密、公有金鑰 ID、私有金鑰 ID、密碼短語,以及做為身分驗證憑證的企業 ID。如需詳細資訊,請參閱公有和私有金鑰對

    注意

    我們建議您定期重新整理或輪換您的登入資料和秘密。僅為您自己的安全提供必要的存取層級。我們不建議您在資料來源以及連接器 1.0 和 2.0 版 (如適用) 之間重複使用登入資料和秘密。

  • 從 Box Developer Console 設定或 Box 應用程式複製 Box 企業 ID。例如,801234567

  • 已檢查每個文件在 Box 中以及您計劃用於相同索引的其他資料來源中是唯一的。您想要用於索引的每個資料來源,不得跨資料來源包含相同的文件。文件 IDs是索引的全域 ID,且每個索引必須是唯一的。

在您的 中 AWS 帳戶,請確定您有:

  • 已建立 Amazon Kendra 索引,如果使用 API,則 會記下索引 ID。

  • 為您的資料來源建立 IAM 角色,如果使用 API, 會記下 IAM 角色的 ARN。

    注意

    如果您變更身分驗證類型和登入資料,則必須更新您的 IAM 角色以存取正確的 AWS Secrets Manager 秘密 ID。

  • 將您的 Box 身分驗證登入資料存放在 AWS Secrets Manager 秘密中,如果使用 API, 會記下秘密的 ARN。

    注意

    我們建議您定期重新整理或輪換您的登入資料和秘密。僅為您自己的安全提供必要的存取層級。我們不建議您在資料來源以及連接器 1.0 和 2.0 版 (如適用) 之間重複使用登入資料和秘密。

如果您沒有現有的 IAM 角色或秘密,則可以使用 主控台,在將 Box 資料來源連接至 時建立新的 IAM 角色和 Secrets Manager 秘密 Amazon Kendra。如果您使用的是 API,則必須提供現有 IAM 角色和 Secrets Manager 秘密的 ARN,以及索引 ID。

連線指示

若要 Amazon Kendra 連線至您的 Box 資料來源,您必須提供 Box 資料來源的必要詳細資訊,以便 Amazon Kendra 可以存取您的資料。如果您尚未為 設定 Box Amazon Kendra,請參閱 先決條件

Console

Amazon Kendra 連線至 Box

  1. 登入 AWS Management Console 並開啟 Amazon Kendra 主控台

  2. 從左側導覽窗格中,選擇索引,然後從索引清單中選擇您要使用的索引。

    注意

    您可以選擇在索引設定下設定或編輯使用者存取控制設定。

  3. 入門頁面上,選擇新增資料來源

  4. 新增資料來源頁面上,選擇方塊連接器,然後選擇新增連接器。如果使用第 2 版 (如適用),請選擇具有「V2.0」標籤的方塊連接器

  5. 指定資料來源詳細資訊頁面上,輸入下列資訊:

    1. 名稱和描述中,針對資料來源名稱—輸入資料來源的名稱。您可以包含連字號,但不能包含空格。

    2. (選用) 描述 — 輸入資料來源的選用描述。

    3. 預設語言 - 選擇語言來篩選索引的文件。除非您另有指定,否則語言預設為英文。文件中繼資料中指定的語言會覆寫選取的語言。

    4. 標籤中,針對新增標籤 - 包含選用標籤,以搜尋和篩選您的資源或追蹤您的 AWS 成本。

    5. 選擇下一步

  6. 定義存取和安全性頁面上,輸入下列資訊:

    1. Box Enterprise ID — 輸入您的 Box Enterprise ID。例如,801234567

    2. 授權:如果您有 ACL 並想要將其用於存取控制,請開啟或關閉文件的存取控制清單 (ACL) 資訊。ACL 會指定使用者和群組可以存取哪些文件。ACL 資訊用於根據使用者或其群組對文件的存取來篩選搜尋結果。如需詳細資訊,請參閱使用者內容篩選

    3. AWS Secrets Manager secret - 選擇現有的秘密或建立新的 Secrets Manager 秘密,以存放您的 Box 身分驗證憑證。如果您選擇建立新的秘密,則會 AWS Secrets Manager 開啟秘密視窗。

      1. 秘密名稱 — 秘密的名稱。字首「AmazonKendra-Box-」會自動新增至您的秘密名稱。

      2. 針對用戶端 ID用戶端秘密公有金鑰 ID私有金鑰 ID密碼 - 輸入您在 Box 中設定的公有/私有金鑰的值。

      3. 新增並儲存您的秘密。

    4. Virtual Private Cloud (VPC) — 您可以選擇使用 VPC。若是如此,您必須新增子網路VPC 安全群組

    5. 身分爬蟲程式 - 指定是否開啟 Amazon Kendra的身分爬蟲程式。身分爬蟲程式會使用文件的存取控制清單 (ACL) 資訊,根據使用者或其群組對文件的存取來篩選搜尋結果。如果您有文件的 ACL 並選擇使用 ACL,您也可以選擇開啟 Amazon Kendra身分爬蟲程式,以設定搜尋結果的使用者內容篩選。否則,如果身分爬蟲程式已關閉,則所有文件都可以公開搜尋。如果您想要對文件使用存取控制,且身分爬蟲程式已關閉,您也可以使用 PutPrincipalMapping API 上傳使用者和群組存取資訊以進行使用者內容篩選。

    6. IAM 角色 - 選擇現有 IAM 角色或建立新的 IAM 角色,以存取您的儲存庫登入資料和索引內容。

      注意

      IAM 用於索引的 角色無法用於資料來源。如果您不確定現有角色是否用於索引或常見問答集,請選擇建立新角色以避免錯誤。

    7. 選擇下一步

  7. 設定同步設定頁面上,輸入下列資訊:

    1. Box 檔案 - 選擇是否要編目 Web 連結、註解和任務。

    2. 對於其他組態 - 新增規則表達式模式,以包含或排除特定內容。

    3. 同步模式 - 選擇當資料來源內容變更時更新索引的方式。當您 Amazon Kendra 第一次使用 同步資料來源時,預設會爬取所有內容並編製索引。如果初始同步失敗,即使您未選擇完全同步作為同步模式選項,仍必須執行資料的完整同步。

      • 完全同步:將所有內容重新編製索引,每次資料來源與索引同步時取代現有的內容。

      • 新的修改後同步:每次資料來源與索引同步時,僅索引新的和修改的內容。 Amazon Kendra 可以使用資料來源的機制來追蹤自上次同步以來變更的內容和索引內容。

      • 新的、修改過的、刪除的同步:每次資料來源與索引同步時,僅索引新的、修改過的和刪除的內容。 Amazon Kendra 可以使用資料來源的機制來追蹤自上次同步以來變更的內容和索引內容。

    4. 頻率同步執行排程中,選擇同步資料來源內容和更新索引的頻率。

    5. 選擇下一步

  8. 設定欄位映射頁面上,輸入下列資訊:

    1. 預設資料來源欄位 - 從您要映射至索引 Amazon Kendra 的產生的預設資料來源欄位中選取 。

    2. 新增欄位 - 新增自訂資料來源欄位,以建立要映射的索引欄位名稱和欄位資料類型。

    3. 選擇下一步

  9. 檢閱和建立頁面上,檢查您輸入的資訊是否正確,然後選取新增資料來源。您也可以選擇從此頁面編輯您的資訊。成功新增資料來源後,您的資料來源將顯示在資料來源頁面上。

API

Amazon Kendra 連線至 Box

您必須使用 BoxConfiguration API 指定下列項目:

Box Enterprise ID - 提供您的 Box Enterprise ID。您可以在 Box 開發人員主控台設定中或在 Box 中設定應用程式時,找到企業 ID。

  • Secret Amazon Resource Name (ARN)—提供秘密的 Amazon Resource Name (ARN) Secrets Manager ,其中包含您 Box 帳戶的身分驗證憑證。秘密會存放在具有下列金鑰的 JSON 結構中:

    { "clientID": "client-id", "clientSecret": "client-secret", "publicKeyID": "public-key-id", "privateKey": "private-key", "passphrase": "pass-phrase" }
  • IAM 角色 - 指定RoleArn您何時呼叫 CreateDataSource 以提供 IAM 角色存取 Secrets Manager 秘密的許可,以及呼叫 Box 連接器和 所需的公有 APIs Amazon Kendra。如需詳細資訊,請參閱 IAM Box 資料來源的角色

您也可以新增下列選用功能:

  • Virtual Private Cloud (VPC)—指定 VpcConfiguration做為資料來源組態的一部分。請參閱設定 Amazon Kendra 以使用 VPC

  • 變更日誌 - 是否 Amazon Kendra 應使用 Box 資料來源變更日誌機制來判斷是否必須在索引中更新文件。

    注意

    如果您不想 Amazon Kendra 掃描所有文件,請使用變更日誌。如果您的變更日誌很大,掃描 Box 資料來源中的文件所需的時間可能比處理變更日誌要 Amazon Kendra 少。如果您是第一次將 Box 資料來源與索引同步,則會掃描所有文件。

  • 註解、任務、Web 連結 - 指定是否要編目這些類型的內容。

    注意

    大多數資料來源使用規則表達式模式,即包含或排除模式,稱為篩選條件。如果您指定包含篩選條件,則只會為符合包含篩選條件的內容編製索引。任何不符合包含篩選條件的文件都不會編製索引。如果您指定包含和排除篩選條件,則符合排除篩選條件的文件不會編製索引,即使它們符合包含篩選條件。

  • 包含和排除篩選條件 - 指定是否包含或排除特定 Box 檔案和資料夾。

    注意

    大多數資料來源使用規則表達式模式,即包含或排除模式,稱為篩選條件。如果您指定包含篩選條件,則只會為符合包含篩選條件的內容編製索引。任何不符合包含篩選條件的文件都不會編製索引。如果您指定包含和排除篩選條件,則符合排除篩選條件的文件不會編製索引,即使它們符合包含篩選條件。

  • 使用者內容篩選和存取控制 —Amazon Kendra 如果您擁有文件的 ACL, 會編目文件的存取控制清單 (ACL)。ACL 資訊用於根據使用者或其群組對文件的存取來篩選搜尋結果。如需詳細資訊,請參閱使用者內容篩選

  • 欄位映射 - 選擇將 Box 資料來源欄位映射至 Amazon Kendra 索引欄位。如需詳細資訊,請參閱映射資料來源欄位

    注意

    需要文件內文欄位或文件內文對等項目, Amazon Kendra 才能搜尋文件。您必須將資料來源中的文件內文欄位名稱映射至索引欄位名稱 _document_body。所有其他欄位是選用的。

Amazon Kendra 連線至 Box

  1. 登入 AWS Management Console 並開啟 Amazon Kendra 主控台

  2. 從左側導覽窗格中,選擇索引,然後從索引清單中選擇您要使用的索引。

    注意

    您可以選擇在索引設定下設定或編輯使用者存取控制設定。

  3. 入門頁面上,選擇新增資料來源

  4. 新增資料來源頁面上,選擇方塊連接器,然後選擇新增連接器。如果使用第 2 版 (如適用),請選擇具有「V2.0」標籤的方塊連接器

  5. 指定資料來源詳細資訊頁面上,輸入下列資訊:

    1. 名稱和描述中,針對資料來源名稱—輸入資料來源的名稱。您可以包含連字號,但不能包含空格。

    2. (選用) 描述 — 輸入資料來源的選用描述。

    3. 預設語言 - 選擇語言來篩選索引的文件。除非您另有指定,否則語言預設為英文。文件中繼資料中指定的語言會覆寫選取的語言。

    4. 標籤中,針對新增標籤 - 包含選用標籤,以搜尋和篩選您的資源或追蹤您的 AWS 成本。

    5. 選擇下一步

  6. 定義存取和安全性頁面上,輸入下列資訊:

    1. Box Enterprise ID — 輸入您的 Box Enterprise ID。例如,801234567

    2. 授權:如果您有 ACL 並想要將其用於存取控制,請開啟或關閉文件的存取控制清單 (ACL) 資訊。ACL 會指定使用者和群組可以存取哪些文件。ACL 資訊用於根據使用者或其群組對文件的存取來篩選搜尋結果。如需詳細資訊,請參閱使用者內容篩選

    3. AWS Secrets Manager secret - 選擇現有的秘密或建立新的 Secrets Manager 秘密,以存放您的 Box 身分驗證憑證。如果您選擇建立新的秘密,則會 AWS Secrets Manager 開啟秘密視窗。

      1. 秘密名稱 — 秘密的名稱。字首「AmazonKendra-Box-」會自動新增至您的秘密名稱。

      2. 針對用戶端 ID用戶端秘密公有金鑰 ID私有金鑰 ID密碼 - 輸入您在 Box 中設定的公有/私有金鑰的值。

      3. 新增並儲存您的秘密。

    4. Virtual Private Cloud (VPC) — 您可以選擇使用 VPC。若是如此,您必須新增子網路VPC 安全群組

    5. 身分爬蟲程式 - 指定是否開啟 Amazon Kendra的身分爬蟲程式。身分爬蟲程式會使用文件的存取控制清單 (ACL) 資訊,根據使用者或其群組對文件的存取來篩選搜尋結果。如果您有文件的 ACL 並選擇使用 ACL,您也可以選擇開啟 Amazon Kendra身分爬蟲程式,以設定搜尋結果的使用者內容篩選。否則,如果身分爬蟲程式已關閉,則所有文件都可以公開搜尋。如果您想要對文件使用存取控制,且身分爬蟲程式已關閉,您也可以使用 PutPrincipalMapping API 上傳使用者和群組存取資訊以進行使用者內容篩選。

    6. IAM 角色 - 選擇現有 IAM 角色或建立新的 IAM 角色,以存取您的儲存庫登入資料和索引內容。

      注意

      IAM 用於索引的 角色無法用於資料來源。如果您不確定現有角色是否用於索引或常見問答集,請選擇建立新角色以避免錯誤。

    7. 選擇下一步

  7. 設定同步設定頁面上,輸入下列資訊:

    1. Box 檔案 - 選擇是否要編目 Web 連結、註解和任務。

    2. 對於其他組態 - 新增規則表達式模式,以包含或排除特定內容。

    3. 同步模式 - 選擇當資料來源內容變更時更新索引的方式。當您 Amazon Kendra 第一次使用 同步資料來源時,預設會爬取所有內容並編製索引。如果初始同步失敗,即使您未選擇完全同步作為同步模式選項,仍必須執行資料的完整同步。

      • 完全同步:將所有內容重新編製索引,每次資料來源與索引同步時取代現有的內容。

      • 新的修改後同步:每次資料來源與索引同步時,僅索引新的和修改的內容。 Amazon Kendra 可以使用資料來源的機制來追蹤自上次同步以來變更的內容和索引內容。

      • 新的、修改過的、刪除的同步:每次資料來源與索引同步時,僅索引新的、修改過的和刪除的內容。 Amazon Kendra 可以使用資料來源的機制來追蹤自上次同步以來變更的內容和索引內容。

    4. 頻率同步執行排程中,選擇同步資料來源內容和更新索引的頻率。

    5. 選擇下一步

  8. 設定欄位映射頁面上,輸入下列資訊:

    1. 預設資料來源欄位 - 從您要映射至索引 Amazon Kendra 的產生的預設資料來源欄位中選取 。

    2. 新增欄位 - 新增自訂資料來源欄位,以建立要映射的索引欄位名稱和欄位資料類型。

    3. 選擇下一步

  9. 檢閱和建立頁面上,檢查您輸入的資訊是否正確,然後選取新增資料來源。您也可以選擇從此頁面編輯您的資訊。成功新增資料來源後,您的資料來源將顯示在資料來源頁面上。

進一步了解

若要進一步了解 Amazon Kendra 如何與您的 Box 資料來源整合,請參閱:

下一個主題:

Confluence

上一個主題:

Amazon WorkDocs
隱私權網站條款Cookie 偏好設定
© 2025, Amazon Web Services, Inc.或其附屬公司。保留所有權利。