文字分類 - TensorFlow - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

文字分類 - TensorFlow

Amazon SageMaker Text Classification - TensorFlow algorithm 是一種監督式學習演算法,支援使用來自 TensorFlow Hub 的許多預先訓練模型進行遷移學習。即使無法提供大量文字資料,您也可以使用轉移學習來微調自己的資料集上其中一個可用的預先訓練模型。文字分類演算法需要一個文字字串作為輸入,並針對每個類別標籤輸出一個機率。訓練資料集必須為 CSV 格式。此頁面包含 Amazon EC2執行個體建議和範例文字分類筆記本的相關資訊 - TensorFlow。

文字分類 - TensorFlow 演算法的 Amazon EC2執行個體建議

文字分類 - TensorFlow 演算法支援所有 CPU和 GPU執行個體進行訓練,包括:

  • ml.p2.xlarge

  • ml.p2.16xlarge

  • ml.p3.2xlarge

  • ml.p3.16xlarge

  • ml.g4dn.xlarge

  • ml.g4dn.16.xlarge

  • ml.g5.xlarge

  • ml.g5.48xlarge

我們建議具有更多記憶體的GPU執行個體,以使用大型批次進行訓練。CPU (例如 M5) 和 GPU(P2、P3, G4dn或 G5) 執行個體都可以用於推論。如需跨 AWS 區域 SageMaker 訓練和推論執行個體的完整清單,請參閱 Amazon SageMaker Pricing

文字分類 - TensorFlow 範例筆記本

如需如何在自訂資料集上使用 SageMaker 文字分類 TensorFlow 演算法進行傳輸學習的詳細資訊,請參閱 JumpStart 文字分類筆記本簡介

如需如何建立和存取可用於在 中執行範例的 Jupyter 筆記本執行個體的說明 SageMaker,請參閱 Amazon SageMaker Notebook 執行個體。在您建立並開啟筆記本執行個體之後,請選取SageMaker範例索引標籤以查看所有 SageMaker 範例的清單。若要開啟筆記本,請選擇其使用標籤,然後選擇建立複本