本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
準備分類器訓練資料
對於自訂分類,您可以在多類別模式或多標籤模式下訓練模型。多類別模式會將單一類別與每個文件建立關聯。多標籤模式會將一或多個類別與每個文件建立關聯。每個模式的輸入檔案格式都不同,因此請在建立訓練資料之前選擇要使用的模式。
注意
Amazon Comprehend 主控台將多類別模式稱為單一標籤模式。
自訂分類支援您使用純文字文件訓練的模型,以及您使用原生文件訓練的模型 (例如 PDF、Word 或映像)。如需分類器模型及其支援的文件類型的詳細資訊,請參閱 訓練分類模型。
若要準備資料以訓練自訂分類器模型:
-
識別您希望此分類器分析的類別。決定要使用的模式 (多類別或多標籤)。
-
根據模型是否用於分析純文字文件或半結構化文件,決定分類器模型類型。
-
收集每個類別的文件範例。如需最低訓練需求,請參閱 文件分類的一般配額。
-
對於純文字模型,選擇要使用的訓練檔案格式 (CSV 檔案或增強型清單檔案)。若要訓練原生文件模型,一律使用 CSV 檔案。