本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
IBM DB2 是由 開發的關聯式資料庫管理系統IBM。如果您是 IBM DB2使用者,您可以使用 Amazon Kendra 為IBM DB2資料來源編製索引。 Amazon Kendra IBM DB2 資料來源連接器支援 DB2 11.5.7。
您可以使用 Amazon Kendra 主控台
如需對 Amazon Kendra IBM DB2資料來源連接器進行故障診斷,請參閱對資料來源進行故障診斷。
支援的功能
-
欄位映射
-
使用者內容篩選
-
包含/排除篩選條件
-
完整和增量內容同步
-
虛擬私有雲端 (VPC)
先決條件
在您可以使用 Amazon Kendra 為IBM DB2資料來源編製索引之前,請在您的 IBM DB2和 AWS 帳戶中進行這些變更。
在 中IBM DB2,請確定您已:
-
記下您的資料庫使用者名稱和密碼。
重要
最佳實務是 Amazon Kendra 提供唯讀資料庫登入資料。
-
已複製您的資料庫主機 URL、連接埠和執行個體。
-
已檢查每個文件在您計劃用於相同索引的其他資料來源中IBM DB2和之間都是唯一的。您想要用於索引的每個資料來源,在資料來源中不得包含相同的文件。文件 IDs是索引的全域 ID,且每個索引必須是唯一的。
在您的 中 AWS 帳戶,請確定您有:
-
已建立 Amazon Kendra 索引,如果使用 API,則 會記下索引 ID。
-
為您的資料來源建立 IAM 角色,如果使用 API, 會記下 IAM 角色的 ARN。
注意
如果您變更身分驗證類型和登入資料,則必須更新您的 IAM 角色,才能存取正確的 AWS Secrets Manager 秘密 ID。
-
將您的IBM DB2身分驗證憑證存放在 AWS Secrets Manager 秘密中,如果使用 API, 會記下秘密的 ARN。
注意
我們建議您定期重新整理或輪換您的登入資料和秘密。僅為您自己的安全提供必要的存取層級。我們不建議您在資料來源和連接器 1.0 和 2.0 版 (如適用) 之間重複使用登入資料和秘密。
如果您沒有現有的 IAM 角色或秘密,則可以使用 主控台,在將IBM DB2資料來源連接到 時建立新的 IAM 角色和 Secrets Manager 秘密 Amazon Kendra。如果您使用 API,則必須提供現有 IAM 角色和 Secrets Manager 秘密的 ARN,以及索引 ID。
連線指示
若要 Amazon Kendra 連線至IBM DB2資料來源,您必須提供IBM DB2登入資料的詳細資訊,讓 Amazon Kendra 可以存取您的資料。如果您尚未設定 IBM DB2 , Amazon Kendra 請參閱 先決條件。
Amazon Kendra 連線至 IBM DB2
-
登入 AWS Management Console 並開啟 Amazon Kendra 主控台
。 -
從左側導覽窗格中,選擇索引,然後從索引清單中選擇您要使用的索引。
注意
您可以選擇在索引設定下設定或編輯使用者存取控制設定。
-
在入門頁面上,選擇新增資料來源。
-
在新增資料來源頁面上,選擇IBM DB2連接器,然後選擇新增連接器。如果使用第 2 版 (如適用),請選擇具有「V2.0」標籤的IBM DB2連接器。
-
在指定資料來源詳細資訊頁面上,輸入下列資訊:
-
在名稱和描述中,針對資料來源名稱—輸入資料來源的名稱。您可以包含連字號,但不能包含空格。
-
(選用) 描述 — 輸入資料來源的選用描述。
-
在預設語言中—選擇語言來篩選索引的文件。除非您另有指定,否則語言預設為英文。文件中繼資料中指定的語言會覆寫選取的語言。
-
在標籤中,針對新增標籤 - 包含選用標籤,以搜尋和篩選您的資源或追蹤您的 AWS 成本。
-
選擇 Next (下一步)。
-
-
在定義存取和安全頁面上,輸入下列資訊:
-
在來源中,輸入下列資訊:
-
主機 — 輸入資料庫主機名稱。
-
連接埠 — 輸入資料庫連接埠。
-
執行個體 - 輸入資料庫執行個體。
-
啟用 SSL 憑證位置 - 選擇輸入 SSL 憑證檔案的 Amazon S3 路徑。
-
在身分驗證中 - 輸入下列資訊:
-
AWS Secrets Manager secret - 選擇現有的秘密或建立新的 Secrets Manager 秘密,以存放您的IBM DB2身分驗證憑證。如果您選擇建立新的秘密,則會 AWS Secrets Manager 開啟秘密視窗。
-
在建立 AWS Secrets Manager 秘密視窗中輸入以下資訊:
-
秘密名稱 — 秘密的名稱。字首「AmazonKendra-IBM DB2-」會自動新增至您的秘密名稱。
-
針對資料庫使用者名稱和密碼 - 輸入您從資料庫複製的身分驗證憑證值。
-
-
選擇 Save (儲存)。
-
-
-
Virtual Private Cloud (VPC):您可以選擇使用 VPC。如果是這樣,您必須新增子網路和 VPC 安全群組。
-
IAM role—選擇現有 IAM 角色或建立新的 IAM 角色,以存取您的儲存庫登入資料和索引內容。
注意
IAM 用於索引的 角色無法用於資料來源。如果您不確定現有角色是否用於索引或常見問答集,請選擇建立新角色以避免錯誤。
-
選擇 Next (下一步)。
-
-
在設定同步設定頁面上,輸入下列資訊:
-
在同步範圍內,從下列選項中選擇 :
-
SQL 查詢 - 輸入類似 SELECT 和 JOIN 操作的 SQL 查詢陳述式。SQL 查詢必須小於 32KB。 Amazon Kendra 會抓取符合查詢的所有資料庫內容。
-
主索引鍵資料欄 - 提供資料庫資料表的主索引鍵。這可識別您資料庫中的資料表。
-
標題欄 - 提供資料庫資料表中文件標題欄的名稱。
-
內文欄:提供資料庫資料表中文件內文欄的名稱。
-
-
在其他組態中 – 選用,從下列選項中選擇同步特定內容,而不是同步所有檔案:
-
變更偵測資料欄 - 輸入 Amazon Kendra 用於偵測內容變更的資料欄名稱。當任何資料欄發生變更時, Amazon Kendra 會重新索引內容。
-
使用者 IDs資料欄 - 輸入資料欄的名稱,其中包含允許存取內容的使用者 IDs。
-
群組資料欄 - 輸入包含允許存取內容之群組的資料欄名稱。
-
來源 URLs欄 — 輸入包含要編製索引之來源 URLs的資料欄名稱。
-
時間戳記欄 — 輸入包含時間戳記的欄名稱。 Amazon Kendra 會使用時間戳記資訊來偵測內容的變更,並僅同步變更的內容。
-
時區資料欄 - 輸入資料欄的名稱,其中包含要爬取內容的時區。
-
時間戳記格式 — 輸入包含時間戳記格式的資料欄名稱,以用於偵測內容變更並重新同步您的內容。
-
-
同步模式 - 選擇您希望在資料來源內容變更時更新索引的方式。當您 Amazon Kendra 第一次使用 同步資料來源時,預設會爬取所有內容並編製索引。如果初始同步失敗,即使您未選擇完全同步做為同步模式選項,仍必須執行資料的完整同步。
-
完全同步:將所有內容重新編製索引,每次資料來源與索引同步時取代現有的內容。
-
新的、修改過的同步:每次資料來源與索引同步時,只索引新的和修改的內容。 Amazon Kendra 可以使用資料來源的機制來追蹤自上次同步以來變更的內容和索引內容。
-
新的、修改過的、刪除的同步:每次資料來源與您的索引同步時,僅索引新的、修改過的和刪除的內容。 Amazon Kendra 可以使用資料來源的機制來追蹤自上次同步以來變更的內容和索引內容。
-
-
在同步執行排程中,針對頻率 - 與您的資料來源 Amazon Kendra 同步的頻率。
-
選擇 Next (下一步)。
-
-
在設定欄位映射頁面上,輸入下列資訊:
-
從產生的預設資料來源欄位中選取您想要映射到 Amazon Kendra 索引的文件 IDs、文件標題和來源 URLs。
-
新增欄位 - 新增自訂資料來源欄位,以建立要映射的索引欄位名稱和欄位資料類型。
-
選擇 Next (下一步)。
-
-
在檢閱和建立頁面上,檢查您輸入的資訊是否正確,然後選取新增資料來源。您也可以選擇從此頁面編輯您的資訊。成功新增資料來源後,您的資料來源將顯示在資料來源頁面上。
備註
-
Amazon Kendra 檢查更新的內容時,不會追蹤已刪除的資料庫資料列。
-
資料庫一列中的欄位名稱和值大小不能超過 400KB。
-
如果您的資料庫資料來源中有大量資料,且不想 Amazon Kendra 在第一次同步後為所有資料庫內容編製索引,您可以選擇只同步新的、修改過的或刪除的文件。
-
最佳實務是 Amazon Kendra 提供唯讀資料庫登入資料。
-
最佳實務是避免新增具有敏感資料或個人識別資訊 (PII) 的資料表。