本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
訓練自訂分類器 (API)
若要建立和訓練自訂分類器,請使用 CreateDocumentClassifier操作。
您可以使用 DescribeDocumentClassifier操作監控請求的進度。Status
欄位轉換為 後TRAINED
,您可以使用分類器對文件進行分類。如果狀態為 TRAINED_WITH_WARNINGS
,分類器訓練輸出請從 CreateDocumentClassifier
操作檢閱 中的略過檔案資料夾。
使用 訓練自訂分類 AWS Command Line Interface
下列範例示範如何搭配 APIs 使用 CreateDocumentClassifier
操作、 DescribeDocumentClassificationJob
操作和其他自訂分類器 AWS CLI。
這些範例已針對 Unix、Linux 和 macOS 格式化。用於 Windows 時,請以插入號 (^) 取代每一行結尾處的 Unix 接續字元斜線 (\)。
使用 create-document-classifier
操作建立純文字自訂分類器。
aws comprehend create-document-classifier \ --region
region
\ --document-classifier-name testDelete \ --language-code en \ --input-data-config S3Uri=s3://S3Bucket
/docclass/file name
\ --data-access-role-arn arn:aws:iam::account number
:role/testFlywheelDataAccess
若要建立原生自訂分類器,請在create-document-classifier
請求中提供下列其他參數。
-
DocumentType:將值設定為 SEMI_STRUCTURED_DOCUMENT。
-
文件:訓練文件的 S3 位置 (以及選擇性的測試文件)。
-
OutputDataConfig:提供輸出文件的 S3 位置 (和選用KMS金鑰)。
-
DocumentReaderConfig:文字擷取設定的選用欄位。
aws comprehend create-document-classifier \ --region
region
\ --document-classifier-name testDelete \ --language-code en \ --input-data-config S3Uri=s3://S3Bucket
/docclass/file name
\ DocumentType \ Documents \ --output-data-config S3Uri=s3://S3Bucket
/docclass/file name
\ --data-access-role-arn arn:aws:iam::account number
:role/testFlywheelDataAccess
ARN 使用 DescribeDocumentClassifier
操作取得具有文件分類器的自訂分類器資訊。
aws comprehend describe-document-classifier \ --region
region
\ --document-classifier-arn arn:aws:comprehend:region
:account number
:document-classifier/file name
使用 DeleteDocumentClassifier
操作刪除自訂分類器。
aws comprehend delete-document-classifier \ --region
region
\ --document-classifier-arn arn:aws:comprehend:region
:account number
:document-classifier/testDelete
使用 ListDocumentClassifiers
操作列出 帳戶中的所有自訂分類器。
aws comprehend list-document-classifiers --region
region
將 AWS SDK for Java 或 SDK 用於 Python
如需如何建立和訓練自訂分類器 SDK 的範例,請參閱 搭CreateDocumentClassifier配使用 AWS SDK或 CLI。