本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
飛輪概述
飛輪是一種 Amazon Comprehend 資源,可協調新版本自訂模型的訓練和評估。您可以建立飛輪以使用現有的訓練模型,或者 Amazon Comprehend 可以為飛輪建立和訓練新模型。將飛輪與純文字自訂模型搭配使用,以進行自訂分類或自訂圖元辨識。
您可以使用 Amazon Comprehend 主控台或 API 來設定和管理飛輪。您也可以使用AWS CloudFormation配置飛輪。
當您建立飛輪時,Amazon Comprehend 會在您的帳戶中建立資料湖。資料湖儲存和管理所有飛輪資料,例如所有模型版本的訓練資料和測試資料。
您可以將作用中模型版本設定為要用於推論任務或 Amazon Comprehend 端點的飛輪模型版本。最初,飛輪包含模型的一個版本。隨著時間的推移,當您訓練新模型版本時,您可以選取效能最佳的版本作為使用中模型版本。當使用者指定飛輪 ARN 來執行推論任務時,Amazon Comprehend 會使用飛輪的作用中模型版本來執行任務。
您會定期取得模型的新標籤資料 (訓練資料或測試資料)。您可以建立一個或多個資料集,讓新資料可供飛輪使用。資料集包含用於訓練或測試與飛輪關聯的自訂模型的輸入資料。Amazon Comprehend 將輸入資料上傳到飛輪的資料湖。
若要將新資料集合到您的自訂模型中,請建立並執行飛輪反覆項目。飛輪版序是使用新資料集來評估作用中模型版本並訓練新模型版本的工作流程。根據現有和新模型版本的量度,您可以決定是否將新模型版本升級為作用中版本。
您可以使用飛輪作用中模型版本來執行自訂分析 (即時或非同步作業)。若要使用飛輪模型進行即時分析,您必須建立飛輪的端點。
使用飛輪不收取額外費用。但是,當您執行飛輪反覆運算時,會產生訓練新模型版本和儲存模型資料的標準費用。如需詳細的定價資訊,請參 Amazon Comprehend
飛輪資料集
若要將新的標籤資料新增至飛輪,您需要建立資料集。您可以將每個資料集設定為訓練資料或測試資料。您可以將資料集與特定飛輪和自訂模型相關聯。
建立資料集之後,Amazon Comprehend 會將資料上傳到飛輪的資料湖。如需詳細資訊,請參閱 飛輪資料湖。
創建飛輪
建立飛輪時,您可以將飛輪與現有訓練模型相關聯,或者飛輪可以建立新模型。
當您使用現有模型建立飛輪時,您可以指定現行模型版本。Amazon Comprehend 會將模型的訓練資料和測試資料複製到飛輪的資料湖中。確保模型訓練和測試資料與建立模型時存在於相同的 Amazon S3 位置。
若要為新模型建立飛輪,請在建立飛輪時提供訓練資料的資料集 (以及測試資料的選用資料集)。當您執行飛輪以建立第一個飛輪迭代時,飛輪會訓練新模型。
訓練自訂模型時,您可以指定自訂標籤清單 (自訂分類) 或自訂圖元 (自訂圖元辨識) 以供模型辨識。請注意以下有關自定義標籤/實體的要點:
-
當您為新模型建立飛輪時,您在建立飛輪期間提供的標籤/圖元清單是飛輪的最終清單。
-
當您從現有模型建立飛輪時,與該模型相關聯的標籤/圖元清單會成為飛輪的最終清單。
-
如果您將新資料集與飛輪產生關聯,且該資料集包含其他標籤/實體,Amazon Comprehend 會忽略新的標籤/實體。
-
您可以使用 API 作業檢閱飛輪的標籤/實體清單。DescribeFlywheel
注意
對於自訂分類,Amazon Comprehend 會在飛輪狀態變為「作用中」之後填入標籤清單。等到飛輪處於活動狀態,然後再調用 DescribeFlywheel API 操作。
飛輪狀態
飛輪在下列狀態之間轉換:
-
創建-Amazon Comprehend 正在創建飛輪資源。您可以在飛輪上執行讀取操作,例如
DescribeFlywheel
。 -
作用中-飛輪處於作用中狀態。您可以決定飛輪版序是否正在進行中,並檢視迭代的狀態。您可以在飛輪上執行讀取動作以及諸如和之類的動作。
DeleteFlywheel
UpdateFlywheel
-
更新-Amazon Comprehend 正在更新飛輪。您可以在飛輪上執行讀取操作。
-
刪除-Amazon Comprehend 正在刪除飛輪。您可以在飛輪上執行讀取操作。
-
失敗-飛輪建立作業失敗。
Amazon Comprehend 刪除飛輪之後,您可以保留飛輪資料湖中所有模型資料的存取權。Amazon Comprehend 會刪除管理飛輪資源所需的所有內部中繼資料。Amazon Comprehend 也會刪除與此飛輪相關聯的資料集 (模型資料會儲存在資料湖中)。
飛輪迭代
當您取得飛輪模型的新訓練或測試資料時,您會建立一或多個新資料集,以便將新資料上傳至飛輪的資料湖。
然後,您可以執行飛輪以建立新的飛輪迭代。飛輪迭代會使用新資料來評估目前的作用中模型版本,並將結果儲存在資料湖中。飛輪也會建立並訓練新的模型版本。
如果新模型的效能優於目前的現行模型版本,您可以將新模型版本晉級為現行模型版本。您可以使用控制台或 UpdateFlywheelAPI 操作來更新現行模型版本。