建立模型 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

建立模型

以下各節說明如何針對每個自訂模型的主要類型建立模型。

注意

如果您在建置後的分析期間遇到錯誤,告知您要增加 ml.m5.2xlarge 執行個體的配額,請參閱要求增加配額

建立自訂數值或分類預測模型

數值和分類預測模型同時支援快速建置標準建置

若要建立數值或分類預測模型,請使用下列程序:

  1. 開啟 SageMaker 畫布應用程式。

  2. 在左側導覽窗格中選擇我的模型

  3. 選擇新模型

  4. 建立新的模型對話方塊中,執行下列動作:

    1. 模型名稱欄位中輸入名稱。

    2. 選取預測分析問題類型。

    3. 選擇建立

  5. 針對選取資料集,請從資料集清單中選取您的資料集。如果您尚未匯入資料,請選擇匯入以轉向至匯入資料工作流程。

  6. 當您準備好開始建置模型時,請選擇選取資料集

  7. 建置索引標籤的目標欄下拉式清單中,選取您要預測的模型目標。

  8. 針對模型類型,Canvas 會自動為您偵測問題類型。如果您要變更類型或設定進階模型設定,請選擇「設定模型」。

    組態模型對話方塊開啟時,請執行以下操作:

    1. 對於「模型」類型,請選擇您要建立的模型類型。

    2. 選擇模型類型後,還有其他進階設定。如需每個進階設定的詳細資訊,請參閱進階模型建置組態。若要設定進階設定,請執行下列動作:

      1. (選用) 在目標指標下拉式清單中選取您要 Canvas 在建置模型時最佳化的指標。如果您未選取指標,Canvas 預設會為您選擇一個指標。如需可用量度的說明,請參閱指標參考

      2. 對於「訓練」方法,請選擇「自動」、「整體」或「超參數最佳化」(HPO) 模式

      3. 對於演算法,請選取您要包含用於建立模型候選項的演算法。

      4. 對於「資料分割」,請以百分比指定在訓練集和驗證集之間分割資料的方式。訓練集用於建置模型,而驗證集則用於測試模型候選者的準確性。

      5. 對於 Max 候選人和執行階段,請執行下列動作:

        1. 設置最大候選值,或 Canvas 可以生成的最大候選模型數量。請注意,最大候選人數僅適用於HPO模式。

        2. 設定「最大工作執行時間」的小時和分鐘值,或 Canvas 可以花費在建立模型的時間上限。在最長時間之後,Canvas 會停止建置並選取最佳候選模型。

    3. 設定進階設定後,請選擇 [儲存]。

  9. 選取或取消選取資料中的資料欄,以將其包含在建置中或刪除。

    注意

    如果您在建置後使用模型進行批次預測,Canvas 會在預測結果中新增刪除的資料欄。但是,Canvas 不會將刪除的資料欄新增至時間序列模型的批次預測中。

  10. (選用) 使用 Canvas 提供的視覺化和分析工具來視覺化您的資料,並決定您想要在模型中包含哪些功能。如需更多資訊,請參閱探索和分析您的資料

  11. (選用) 使用資料轉換來清理、轉換和準備用於模型建置的資料。如需更多資訊,請參閱使用進階轉換準備資料。您可以選擇模型配方以開啟模型配方側邊面板來檢視和移除轉換。

  12. (選用) 如需其他功能,例如預覽模型的準確性、驗證資料集,以及變更 Canvas 從資料集取得的隨機範例大小,請參閱預覽模型

  13. 檢閱資料並對資料集進行任何變更後,請選擇快速建置標準建置以開始建置您的模型。下列螢幕擷取畫面顯示建置頁面和快速建置標準建置選項。

    2 類別模型的建置頁面會顯示快速建置和標準建置選項。

模型開始建置後,您可以離開此頁面。當模型在我的模型頁面上顯示為就緒時就可以進行分析和預測。

建置自訂映像預測模型

單一標籤影像預測模型同時支援快速建置標準建置

若要建立單一標籤影像預測模型,請遵循下列程序:

  1. 開啟 SageMaker 畫布應用程式。

  2. 在左側導覽窗格中選擇我的模型

  3. 選擇新模型

  4. 建立新的模型對話方塊中,執行下列動作:

    1. 模型名稱欄位中輸入名稱。

    2. 選取影像分析問題類型。

    3. 選擇建立

  5. 針對選取資料集,請從資料集清單中選取您的資料集。如果您尚未匯入資料,請選擇匯入以轉向至匯入資料工作流程。

  6. 當您準備好開始建置模型時,請選擇選取資料集

  7. 建置索引標籤上,您會看到資料集中影像的標籤分佈模型類型設定為單一標籤影像預測

  8. 在此頁面上,您可以預覽影像並編輯資料集。如果您有任何未標籤的影像,請選擇編輯資料集為未標籤的影像指派標籤。當您編輯影像資料集時也可以執行其他任務,例如重新命名標籤,以及將影像新增至資料集。

  9. 檢閱資料並對資料集進行任何變更後,請選擇快速建置標準建置以開始建置您的模型。下列螢幕擷取畫面顯示已就緒,且可以建置的映像預測模型的建置頁面。

    單一標籤影像預測模型的建置頁面。

模型開始建置後,您可以離開此頁面。當模型在我的模型頁面上顯示為就緒時就可以進行分析和預測。

建置自訂文字預測模型

多類別文字預測模型同時支援快速建置標準建置

若要建立文字預測模型,請遵循下列程序:

  1. 開啟 SageMaker 畫布應用程式。

  2. 在左側導覽窗格中選擇我的模型

  3. 選擇新模型

  4. 建立新的模型對話方塊中,執行下列動作:

    1. 模型名稱欄位中輸入名稱。

    2. 選取文字分析問題類型。

    3. 選擇建立

  5. 針對選取資料集,請從資料集清單中選取您的資料集。如果您尚未匯入資料,請選擇匯入以轉向至匯入資料工作流程。

  6. 當您準備好開始建置模型時,請選擇選取資料集

  7. 建置索引標籤的目標欄下拉式清單中,選取您要預測的模型目標。目標欄必須有二進位或分類資料類型,而且目標欄中的每個唯一標籤必須至少有 25 個項目 (或資料列)。

  8. 針對模型類型,請確認模型類型已自動設定為 多類別文字預測

  9. 針對訓練資料欄,請選取文字資料的來源資料欄。這應該為包含您要分析的文字的資料欄。

  10. 選擇快速建置標準建置以開始建置模型。下列螢幕擷取畫面顯示已就緒,且可以建置的文字預測模型的建置頁面。

    多類別文字預測模型的建置頁面。

模型開始建置後,您可以離開此頁面。當模型在我的模型頁面上顯示為就緒時就可以進行分析和預測。

建立時間序列預測模型

時間序列預測模型同時支援快速組建標準組建

若要建立時間序列預測模型,請遵循下列步驟:

  1. 開啟 SageMaker 畫布應用程式。

  2. 在左側導覽窗格中選擇我的模型

  3. 選擇新模型

  4. 建立新的模型對話方塊中,執行下列動作:

    1. 模型名稱欄位中輸入名稱。

    2. 選取「時間序列」預測問題型態。

    3. 選擇 Create (建立)。

  5. 針對選取資料集,請從資料集清單中選取您的資料集。如果您尚未匯入資料,請選擇匯入以轉向至匯入資料工作流程。

  6. 當您準備好開始建置模型時,請選擇選取資料集

  7. 建置索引標籤的目標欄下拉式清單中,選取您要預測的模型目標。

  8. 在「模型類型」區段中,選擇「規劃模型」。

  9. 組態模型」方塊開啟。在「時間序列組態」區段中,填寫下列欄位:

    1. 在「項目 ID」欄中,選擇資料集中唯一識別每一列的資料欄。

    2. (選擇性) 在「群組」欄位中,選擇一或多個要用於分組預測值的分類欄位。

    3. 在「時間戳記」欄中,選取具有時間戳記的欄 (日期時間格式)。如需有關可接受之日期時間格式的詳細資訊,請參閱Amazon SageMaker 畫布中的時間序列預測

    4. 在「Fo recast 長度」欄位中,輸入您要預測值的期間。畫布會自動檢測數據中的時間單位。

    5. (選擇性) 開啟 [使用假日排程] 切換,以選取來自不同國家/地區的假日排程,並讓您的預測與假日資料更加準確。

  10. 在「規劃模型」方塊中,「進階」區段中還有其他設定。如需每個進階設定的詳細資訊,請參閱進階模型建置組態。若要設定進設定,請執行下列動作:

    1. 對於「目標量度」下拉式功能表,選取您要 Canvas 在建置模型時最佳化的量度。如果您未選取指標,Canvas 預設會為您選擇一個指標。如需可用量度的說明,請參閱指標參考

    2. 如果您正在執行標準組建,您會看到「演算法」區段。本節用於選取您要用於建置模型的時間序列預測演算法。您可以選擇可用算法的一個子集,或者如果不確定要嘗試哪些算法,則可以選擇所有演算法。

      當您執行標準組建時,Canvas 會建立整體模型,將所有演算法結合在一起,以最佳化預測準確度。

      注意

      如果您正在執行快速建置,Canvas 會使用單一樹狀結構學習演算法來訓練模型,而且您不需要選取任何演算法。

    3. 對於「Forecast 分位數」,請輸入最多 5 個逗號分隔的分位數值,以指定預測的上限和下限。

    4. 設定「進階」設定後,請選擇「儲存」。

  11. 選取或取消選取資料中的資料欄,以將其包含在建置中或刪除。

    注意

    如果您在建置後使用模型進行批次預測,Canvas 會在預測結果中新增刪除的資料欄。但是,Canvas 不會將刪除的資料欄新增至時間序列模型的批次預測中。

  12. (選用) 使用 Canvas 提供的視覺化和分析工具來視覺化您的資料,並決定您想要在模型中包含哪些功能。如需更多資訊,請參閱探索和分析您的資料

  13. (選用) 使用資料轉換來清理、轉換和準備用於模型建置的資料。如需更多資訊,請參閱使用進階轉換準備資料。您可以選擇模型配方以開啟模型配方側邊面板來檢視和移除轉換。

  14. (選用) 如需其他功能,例如預覽模型的準確性、驗證資料集,以及變更 Canvas 從資料集取得的隨機範例大小,請參閱預覽模型

  15. 檢閱資料並對資料集進行任何變更後,請選擇快速建置標準建置以開始建置您的模型。

模型開始建置後,您可以離開此頁面。當模型在我的模型頁面上顯示為就緒時就可以進行分析和預測。