訓練自訂分類器 (API) - Amazon Comprehend

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

訓練自訂分類器 (API)

若要建立和訓練自訂分類器,請使用 CreateDocumentClassifier操作。

您可以使用 DescribeDocumentClassifier操作監控請求的進度。Status 欄位轉換為 後TRAINED,您可以使用分類器對文件進行分類。如果狀態為 TRAINED_WITH_WARNINGS分類器訓練輸出請從 CreateDocumentClassifier操作檢閱 中的略過檔案資料夾。

使用 訓練自訂分類 AWS Command Line Interface

下列範例示範如何搭配 APIs 使用 CreateDocumentClassifier操作、 DescribeDocumentClassificationJob操作和其他自訂分類器 AWS CLI。

這些範例已針對 Unix、Linux 和 macOS 格式化。用於 Windows 時,請以插入號 (^) 取代每一行結尾處的 Unix 接續字元斜線 (\)。

使用 create-document-classifier操作建立純文字自訂分類器。

aws comprehend create-document-classifier \ --region region \ --document-classifier-name testDelete \ --language-code en \ --input-data-config S3Uri=s3://S3Bucket/docclass/file name \ --data-access-role-arn arn:aws:iam::account number:role/testFlywheelDataAccess

若要建立原生自訂分類器,請在create-document-classifier請求中提供下列其他參數。

  1. DocumentType:將值設定為 SEMI_STRUCTURED_DOCUMENT。

  2. 文件:訓練文件的 S3 位置 (以及選擇性的測試文件)。

  3. OutputDataConfig:提供輸出文件的 S3 位置 (和選用KMS金鑰)。

  4. DocumentReaderConfig:文字擷取設定的選用欄位。

aws comprehend create-document-classifier \ --region region \ --document-classifier-name testDelete \ --language-code en \ --input-data-config S3Uri=s3://S3Bucket/docclass/file name \ DocumentType \ Documents \ --output-data-config S3Uri=s3://S3Bucket/docclass/file name \ --data-access-role-arn arn:aws:iam::account number:role/testFlywheelDataAccess

ARN 使用 DescribeDocumentClassifier操作取得具有文件分類器的自訂分類器資訊。

aws comprehend describe-document-classifier \ --region region \ --document-classifier-arn arn:aws:comprehend:region:account number:document-classifier/file name

使用 DeleteDocumentClassifier操作刪除自訂分類器。

aws comprehend delete-document-classifier \ --region region \ --document-classifier-arn arn:aws:comprehend:region:account number:document-classifier/testDelete

使用 ListDocumentClassifiers操作列出 帳戶中的所有自訂分類器。

aws comprehend list-document-classifiers --region region

將 AWS SDK for Java 或 SDK 用於 Python

如需如何建立和訓練自訂分類器 SDK 的範例,請參閱 搭CreateDocumentClassifier配使用 AWS SDK或 CLI