選取您的 Cookie 偏好設定

我們使用提供自身網站和服務所需的基本 Cookie 和類似工具。我們使用效能 Cookie 收集匿名統計資料,以便了解客戶如何使用我們的網站並進行改進。基本 Cookie 無法停用,但可以按一下「自訂」或「拒絕」以拒絕效能 Cookie。

如果您同意,AWS 與經核准的第三方也會使用 Cookie 提供實用的網站功能、記住您的偏好設定,並顯示相關內容,包括相關廣告。若要接受或拒絕所有非必要 Cookie,請按一下「接受」或「拒絕」。若要進行更詳細的選擇,請按一下「自訂」。

訓練分類模型

焦點模式
訓練分類模型 - Amazon Comprehend

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

若要訓練自訂分類的模型,您可以定義類別並提供範例文件來訓練自訂模型。您可以在多類別或多標籤模式中訓練模型。多類別模式會將單一類別與每個文件建立關聯。多標籤模式會將一或多個類別與每個文件建立關聯。

自訂分類支援兩種類型的分類器模型:純文字模型和原生文件模型。純文字模型會根據文件的文字內容來分類文件。原生文件模型也會根據文字內容來分類文件。原生文件模型也可以使用其他訊號,例如來自文件配置的訊號。您可以使用原生文件來訓練原生文件模型,讓模型了解配置資訊。

純文字模型具有下列特性:

  • 您可以使用 UTF-8 編碼的文字文件來訓練模型。

  • 您可以使用下列其中一種語言的文件來訓練模型:英文、西班牙文、德文、義大利文、法文或葡萄牙文。

  • 指定分類器的訓練文件必須使用相同的語言。

  • 訓練文件為純文字,因此文字擷取無需額外費用。

原生文件模型具有下列特性:

  • 您可以使用半結構化文件來訓練模型,其中包括下列文件類型:

    • 數位和掃描的 PDF 文件。

    • Word 文件 (DOCX)。

    • 影像:JPG 檔案、PNG 檔案和單頁 TIFF 檔案。

    • Textract API 輸出 JSON 檔案。

  • 您可以使用英文文件來訓練模型。

  • 如果您的訓練文件包含掃描的文件檔案,則文字擷取會產生額外費用。如需詳細資訊,請參閱 Amazon Comprehend 定價頁面。

您可以使用任一類型模型來分類任何支援的文件類型。不過,為了取得最準確的結果,我們建議您使用純文字模型來分類純文字文件,並使用原生文件模型來分類半結構化文件。

隱私權網站條款Cookie 偏好設定
© 2025, Amazon Web Services, Inc.或其附屬公司。保留所有權利。