

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 訓練自訂分類器 （主控台）
<a name="create-custom-classifier-console"></a>

您可以使用主控台建立和訓練自訂分類器，然後使用自訂分類器來分析文件。

若要訓練自訂分類器，您需要一組訓練文件。您可以使用您希望文件分類器辨識的類別來標記這些文件。如需準備訓練文件的資訊，請參閱 [準備分類器訓練資料](prep-classifier-data.md)。



**建立和訓練文件分類器模型**

1. 登入 AWS 管理主控台 並前往 https：//[https://console.aws.amazon.com/comprehend/](https://console.aws.amazon.com/comprehend/) 開啟 Amazon Comprehend 主控台

1. 從左側功能表中，選擇**自訂**，然後選擇**自訂分類**。

1. 選擇**建立新模型**。

1. 在**模型設定**下，輸入分類器的模型名稱。名稱在您的帳戶和目前區域中必須是唯一的。

   （選用） 輸入版本名稱。名稱在您的帳戶和目前區域中必須是唯一的。

1. 選取訓練文件的語言。若要查看分類器支援的語言，請參閱 [訓練分類模型](training-classifier-model.md)。

1. （選用） 如果您想要在 Amazon Comprehend 處理訓練工作時加密儲存磁碟區中的資料，請選擇**分類器加密**。然後選擇要使用與目前帳戶相關聯的 KMS 金鑰，還是使用另一個帳戶的 KMS 金鑰。
   + 如果您使用的是與目前帳戶相關聯的金鑰，請選擇 **KMS 金鑰 ID 的金鑰 ID**。
   + 如果您使用的是與不同帳戶相關聯的金鑰，請在 **KMS 金鑰 ARN 下輸入金鑰 ID 的 ARN**。
**注意**  
如需建立和使用 KMS 金鑰和相關聯加密的詳細資訊，請參閱 [AWS Key Management Service (AWS KMS)](https://docs.aws.amazon.com/kms/latest/developerguide/overview.html)。

1. 在**資料規格**下，選擇要使用**的訓練模型類型**。
   + **純文字文件：**選擇此選項可建立純文字模型。使用純文字文件訓練模型。
   + **原生文件：**選擇此選項可建立原生文件模型。使用原生文件 (PDF、Word、映像） 訓練模型。

1. 選擇訓練**資料的資料格式**。如需資料格式的資訊，請參閱 [分類器訓練檔案格式](prep-class-data-format.md)。
   + **CSV 檔案：**如果您的訓練資料使用 CSV 檔案格式，請選擇此選項。
   + **增強的資訊清單：**如果您使用 Ground Truth 為訓練資料建立增強的資訊清單檔案，請選擇此選項。如果您選擇**純文字文件**做為訓練模型類型，即可使用此格式。

1. 選擇要使用的**分類器模式**。
   + **單一標籤模式：**如果您指派給文件的類別是互斥的，而且您正在訓練分類器為每個文件指派一個標籤，請選擇此模式。在 Amazon Comprehend API 中，單一標籤模式稱為多類別模式。
   + **多標籤模式：**如果可同時將多個類別套用至文件，且您正在訓練分類器來為每個文件指派一或多個標籤，請選擇此模式。

1. 如果您選擇**多標籤模式**，您可以選取**標籤的分隔符號**。當訓練文件有多個類別時，使用此分隔符號字元來分隔標籤。預設分隔符號是管道字元。

1. （選用） 如果您選擇**擴增資訊清單**做為資料格式，您最多可以輸入五個擴增資訊清單檔案。每個擴增的資訊清單檔案都包含訓練資料集或測試資料集。您必須提供至少一個訓練資料集。測試資料集是選用的。使用下列步驟來設定擴增的資訊清單檔案：

   1. 在**訓練和測試資料集**下，展開**輸入位置**面板。

   1. 在**資料集類型**中，選擇**訓練資料**或**測試資料**。

   1. 針對 **SageMaker AI Ground Truth 擴增資訊清單檔案 S3 位置**，輸入包含資訊清單檔案的 Amazon S3 儲存貯體位置，或選擇**瀏覽 S3** 來導覽至其中。您用於訓練任務存取許可的 IAM 角色必須具有 S3 儲存貯體的讀取許可。

   1. 針對**屬性名稱**，輸入包含註釋的屬性名稱。如果檔案包含來自多個鏈結標記任務的註釋，請為每個任務新增 屬性。

   1. 若要新增另一個輸入位置，請選擇**新增輸入位置**，然後設定下一個位置。

1. （選用） 如果您選擇 **CSV 檔案**做為資料格式，請使用下列步驟來設定訓練資料集和選用測試資料集：

   1. 在**訓練資料集**下，輸入包含訓練資料 CSV 檔案的 Amazon S3 儲存貯體位置，或選擇**瀏覽 S3** 來導覽至該儲存貯體。您用於訓練任務存取許可的 IAM 角色必須具有 S3 儲存貯體的讀取許可。

      （選用） 如果您選擇**原生文件**做為訓練模型類型，您也可以提供包含訓練範例檔案的 Amazon S3 資料夾 URL。

   1. 在**測試資料集**下，選取您是否為 Amazon Comprehend 提供額外的資料，以測試訓練過的模型。
      + **Autosplit**：Autosplit 會自動選取 10% 的訓練資料，以保留做為測試資料。
      + （選用） **客戶提供**：在 Amazon S3 中輸入測試資料 CSV 檔案的 URL。您也可以導覽至其在 Amazon S3 中的位置，然後選擇**選取資料夾**。

        （選用） 如果您選擇**原生文件**做為訓練模型類型，您也可以提供包含測試檔案的 Amazon S3 資料夾 URL。

1. （選用） 對於**文件讀取模式**，您可以覆寫預設的文字擷取動作。純文字模型不需要此選項，因為它適用於掃描文件的文字擷取。如需詳細資訊，請參閱[設定文字擷取選項](idp-set-textract-options.md)。

1. （純文字模型為選用） 對於**輸出資料**，輸入 Amazon S3 儲存貯體的位置以儲存訓練輸出資料，例如混淆矩陣。如需詳細資訊，請參閱[混淆矩陣](train-classifier-output.md#conf-matrix)。

   （選用） 如果您選擇加密訓練任務的輸出結果，請選擇**加密**。然後選擇要使用與目前帳戶相關聯的 KMS 金鑰，還是使用另一個帳戶的 KMS 金鑰。
   + 如果您使用的是與目前帳戶相關聯的金鑰，請選擇 **KMS 金鑰 ID 的金鑰**別名。
   + 如果您使用的是與不同帳戶相關聯的金鑰，請在 **KMS 金鑰** ID 下輸入金鑰別名或 ID 的 ARN。

1. 針對 **IAM 角色**，選擇**選擇現有的 IAM 角色**，然後選擇具有包含訓練文件之 S3 儲存貯體讀取許可的現有 IAM 角色。角色必須具有開頭為 的信任政策`comprehend.amazonaws.com`，才能有效。

   如果您還沒有具有這些許可的 IAM 角色，請選擇**建立 IAM 角色**來建立。選擇授予此角色的存取許可，然後選擇名稱尾碼，以區分帳戶中的角色與 IAM 角色。
**注意**  
對於加密的輸入文件，使用的 IAM 角色也必須具有 `kms:Decrypt` 許可。如需詳細資訊，請參閱[使用 KMS 加密所需的許可](security_iam_id-based-policy-examples.md#auth-kms-permissions)。

1. （選用） 若要從 VPC 將您的資源啟動至 Amazon Comprehend，請在 VPC 下輸入 **VPC** ID，或從下拉式清單中選擇 ID。

   1. 選擇子網路 **（子網路） 下的子網路**。選取第一個子網路之後，您可以選擇其他子網路。

   1. 在**安全群組 (Security Group)** 下，如果您指定安全群組，請選擇要使用的安全群組。選取第一個安全群組之後，您可以選擇其他安全群組。
**注意**  
當您搭配分類任務使用 VPC 時，`DataAccessRole`用於建立和啟動操作的 必須具有存取輸入文件和輸出儲存貯體的 VPC 許可。

1. （選用） 若要將標籤新增至自訂分類器，請在**標籤**下輸入鍵值對。選擇 **Add tag (新增標籤)**。若要在建立分類器之前移除此對，請選擇**移除標籤**。如需詳細資訊，請參閱[標記您的  資源](tagging.md)。

1. 選擇**建立**。

主控台會顯示**分類器**頁面。新的分類器會出現在資料表中，顯示`Submitted`為其狀態。當分類器開始處理訓練文件時，狀態會變更為 `Training`。當分類器可供使用時，狀態會變更為 `Trained`或 `Trained with warnings`。如果狀態為 `TRAINED_WITH_WARNINGS`，請檢閱 中略過的檔案資料夾[分類器訓練輸出](train-classifier-output.md)。

如果 Amazon Comprehend 在建立或訓練期間遇到錯誤，狀態會變更為 `In error`。您可以在 資料表中選擇分類器任務，以取得有關分類器的詳細資訊，包括任何錯誤訊息。

![\[自訂分類器清單。\]](http://docs.aws.amazon.com/zh_tw/comprehend/latest/dg/images/class-list.png)
