文件屬性或欄位 - Amazon Kendra

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

文件屬性或欄位

文件具有與其相關聯的屬性或欄位。一個文檔的字段是一個文檔或什麼是包含在一個文檔的結構中的屬性。例如,您的每份文件可能包含標題、內文和作者。您還可以為特定文檔添加自定義字段。例如,如果您的索引搜尋稅務文件,您可以指定稅務文件類型的自訂欄位,例如 W-2、1099 等。

您必須先對應至索引欄位,才能在查詢中使用文件欄位。例如,標題欄位可以對應至欄位_document_title。如需詳細資訊,請參閱對應欄位。若要新增欄位,您必須建立索引欄位來對應欄位。您可以使用主控台或使用建立索引欄位UpdateIndexAPI。

您可以使用文件欄位來篩選回應,以及製作多面向搜尋結果。例如,您可以篩選回應,使其只傳回特定版本的文件,或者您可以篩選搜尋結果,使其僅傳回符合搜尋字詞的 1099 類型稅務文件。如需詳細資訊,請參閱篩選和刻面搜尋

您也可以使用文件欄位來手動調整查詢回應。例如,您可以選擇增加標題欄位的重要性,以增加標題欄位的權重 Amazon Kendra 決定要在回應中傳回的文件時,指派給欄位。如需詳細資訊,請參閱調整搜尋相關性

如果您要將文件直接加入至索引,您可以將 Document 輸入參數中的欄位指定給BatchPutDocumentAPI。您可以在DocumentAttribute物件陣列中指定自訂欄位值。如果您使用的是資料來源,則用來新增文件欄位的方法取決於資料來源。如需詳細資訊,請參閱映射資料來源欄位

使用 Amazon Kendra 保留或一般文件欄位

使用 UpdateIndex API,您可以使用DocumentMetadataConfigurationUpdates和指定來建立保留欄位或共用欄位 Amazon Kendra 保留索引欄位名稱,以對應至您的對等文件屬性/欄位名稱。您也可以建立自訂欄位。如果您使用資料來源連接器,大多數都會包含將資料來源文件欄位對映到的欄位對映 Amazon Kendra 索引欄位。如果您使用主控台,您可以透過選取資料來源、選取編輯動作,然後繼續進行欄位對應區段旁邊以配置資料來源來更新欄位。

您可以設定Search物件以將欄位設定為可顯示、可變更、可搜尋和可排序。您可以將Relevance物件設定為設定欄位的排名順序、提升持續時間或時段,以套用至提升、新鮮度、重要性值,以及對應至特定欄位值的重要性值。如果使用控制台,則可以透過選取導覽功能表中的 Facet 選項來設定欄位的搜尋設定。若要設定相關性調整,請在導覽功能表中選取搜尋索引的選項、輸入查詢,然後使用側邊面板選項來調整搜尋相關性。建立欄位後,就無法變更欄位類型。

Amazon Kendra 您可以使用下列保留或一般文件欄位:

  • _authors負責文件內容的一或多個作者清單。

  • _category將文件放置在特定群組中的類別。

  • _created_at以 ISO 8601 格式建立文件的日期和時間。例如,2012-03-25T12:30:10 + ISO 01:00 是歐洲中部時間中部時間的 2012 年 3 月 25 日下午 12 時 30 分(加上 10 秒)的 8601 日期時間格式。

  • _data_source_id包含文件之資料來源的識別碼。

  • _document_body文件的內容。

  • _document_id文件的唯一識別元。

  • _document_title文件的標題。

  • _excerpt_page_number出現文件摘錄的PDF檔案中的頁碼。如果您的索引是在 2020 年 9 月 8 日之前建立的,您必須重新建立文件索引,才能使用此屬性。

  • _faq_id如果這是問答類型文件 (FAQ),則為. FAQ

  • _file_type文件的檔案類型,例如 pdf 或 doc。

  • _last_updated_at上次更新文件的日期和時間 (採用 ISO 8601 格式)。例如,2012-03-25T12:30:10 + ISO 01:00 是歐洲中部時間中部時間的 2012 年 3 月 25 日下午 12 時 30 分(加上 10 秒)的 8601 日期時間格式。

  • _source_uri可用文件的URI位置。例如,在URI公司網站上的文檔。

  • _version文件特定版本的識別元。

  • _view_count檢視文件的次數。

  • _language_code(字串)-套用至文件之語言的程式碼。如果您未指定語言,則預設為英文。如需支援語言 (包括其代碼) 的詳細資訊,請參閱以英文以外的語言新增文件

對於自訂欄位,您可以使DocumentMetadataConfigurationUpdates用建立這些欄位 UpdateIndexAPI,就像在建立保留或公用欄位時一樣。您必須為自訂欄位設定適當的資料類型。如果您使用主控台,您可以透過選取資料來源、選取編輯動作,然後繼續進行欄位對應區段旁邊以配置資料來源來更新欄位。某些資料來源不支援新增欄位或自訂欄位。建立欄位後,就無法變更欄位類型。

以下是您可以為自訂欄位設定的類型:

  • 日期

  • Number

  • 字串

  • 字串清單

如果您使用將文件新增至索引 BatchPutDocumentAPI,會Attributes列出文件的欄位/屬性,並使用物件建立欄位。DocumentAttribute

對於編製索引的文件 Amazon S3 資料來源時,您可以使用包含欄位資訊的JSON中繼資料檔案來建立欄位。

如果您使用支援的資料庫做為資料來源,您可以使用欄位對應選項來設定欄位。