建立模型 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

建立模型

以下各節說明如何針對每個自訂模型的主要類型建立模型。

注意

如果您在建置後的分析期間遇到錯誤,告知您要增加 ml.m5.2xlarge 執行個體的配額,請參閱要求增加配額

建立自訂數值或分類預測模型

數值和分類預測模型同時支援快速建置標準建置

若要建立數值或分類預測模型,請使用下列程序:

  1. 開啟 SageMaker Canvas 應用程式。

  2. 在左側導覽窗格中選擇我的模型

  3. 選擇新模型

  4. 建立新的模型對話方塊中,執行下列動作:

    1. 模型名稱欄位中輸入名稱。

    2. 選取預測分析問題類型。

    3. 選擇建立

  5. 針對選取資料集,請從資料集清單中選取您的資料集。如果您尚未匯入資料,請選擇匯入以轉向至匯入資料工作流程。

  6. 當您準備好開始建置模型時,請選擇選取資料集

  7. 建置索引標籤的目標欄下拉式清單中,選取您要預測的模型目標。

  8. 針對模型類型,Canvas 會自動為您偵測問題類型。如果您想要變更類型或設定進階模型設定,請選擇設定模型

    設定模型對話方塊開啟時,請執行下列動作:

    1. 針對模型類型 ,選擇您要建置的模型類型。

    2. 選擇模型類型後,還有其他進階設定 。如需每個進階設定的詳細資訊,請參閱 進階模型建置組態。若要設定進階設定,請執行下列動作:

      1. (選用) 在目標指標下拉式清單中選取您要 Canvas 在建置模型時最佳化的指標。如果您未選取指標,Canvas 預設會為您選擇一個指標。如需可用指標的說明,請參閱 指標參考

      2. 針對訓練方法 ,選擇自動 組合 超參數最佳化 (HPO) 模式

      3. 針對演算法 ,選取您要包含的演算法以建置模型候選項目。

      4. 對於資料分割 ,請以百分比指定您希望在訓練集驗證集 之間分割資料的方式。訓練集用於建置模型,而驗證集用於測試模型候選項目的準確性。

      5. 對於最大候選和執行期 ,請執行下列動作:

        1. 設定 Canvas 可以產生的最大候選項目值或模型候選項目數量上限。請注意,最大候選項目僅在HPO模式下可用。

        2. 設定任務執行時間上限 的小時和分鐘值,或 Canvas 可以花費在建置模型的最長時間。在最長時間之後,Canvas 會停止建置並選擇最佳模型候選。

    3. 設定進階設定後,選擇儲存

  9. 選取或取消選取資料中的資料欄,以將其包含在建置中或刪除。

    注意

    如果您在建置後使用模型進行批次預測,Canvas 會在預測結果中新增刪除的資料欄。但是,Canvas 不會將刪除的資料欄新增至時間序列模型的批次預測中。

  10. (選用) 使用 Canvas 提供的視覺化和分析工具來視覺化您的資料,並決定您想要在模型中包含哪些功能。如需更多資訊,請參閱探索和分析您的資料

  11. (選用) 使用資料轉換來清理、轉換和準備用於模型建置的資料。如需更多資訊,請參閱使用進階轉換準備資料。您可以選擇模型配方以開啟模型配方側邊面板來檢視和移除轉換。

  12. (選用) 如需其他功能,例如預覽模型的準確性、驗證資料集,以及變更 Canvas 從資料集取得的隨機範例大小,請參閱預覽模型

  13. 檢閱資料並對資料集進行任何變更後,請選擇快速建置標準建置以開始建置您的模型。下列螢幕擷取畫面顯示建置頁面和快速建置標準建置選項。

    2 類別模型的建置頁面會顯示快速建置和標準建置選項。

模型開始建置後,您可以離開此頁面。當模型在我的模型頁面上顯示為就緒時就可以進行分析和預測。

建置自訂映像預測模型

單一標籤影像預測模型同時支援快速建置標準建置

若要建立單一標籤影像預測模型,請遵循下列程序:

  1. 開啟 SageMaker Canvas 應用程式。

  2. 在左側導覽窗格中選擇我的模型

  3. 選擇新模型

  4. 建立新的模型對話方塊中,執行下列動作:

    1. 模型名稱欄位中輸入名稱。

    2. 選取影像分析問題類型。

    3. 選擇建立

  5. 針對選取資料集,請從資料集清單中選取您的資料集。如果您尚未匯入資料,請選擇匯入以轉向至匯入資料工作流程。

  6. 當您準備好開始建置模型時,請選擇選取資料集

  7. 建置索引標籤上,您會看到資料集中影像的標籤分佈模型類型設定為單一標籤影像預測

  8. 在此頁面上,您可以預覽影像並編輯資料集。如果您有任何未標籤的影像,請選擇編輯資料集為未標籤的影像指派標籤。當您編輯影像資料集時也可以執行其他任務,例如重新命名標籤,以及將影像新增至資料集。

  9. 檢閱資料並對資料集進行任何變更後,請選擇快速建置標準建置以開始建置您的模型。下列螢幕擷取畫面顯示已就緒,且可以建置的映像預測模型的建置頁面。

    單一標籤影像預測模型的建置頁面。

模型開始建置後,您可以離開此頁面。當模型在我的模型頁面上顯示為就緒時就可以進行分析和預測。

建置自訂文字預測模型

多類別文字預測模型同時支援快速建置標準建置

若要建立文字預測模型,請遵循下列程序:

  1. 開啟 SageMaker Canvas 應用程式。

  2. 在左側導覽窗格中選擇我的模型

  3. 選擇新模型

  4. 建立新的模型對話方塊中,執行下列動作:

    1. 模型名稱欄位中輸入名稱。

    2. 選取文字分析問題類型。

    3. 選擇建立

  5. 針對選取資料集,請從資料集清單中選取您的資料集。如果您尚未匯入資料,請選擇匯入以轉向至匯入資料工作流程。

  6. 當您準備好開始建置模型時,請選擇選取資料集

  7. 建置索引標籤的目標欄下拉式清單中,選取您要預測的模型目標。目標欄必須有二進位或分類資料類型,而且目標欄中的每個唯一標籤必須至少有 25 個項目 (或資料列)。

  8. 針對模型類型,請確認模型類型已自動設定為 多類別文字預測

  9. 針對訓練資料欄,請選取文字資料的來源資料欄。這應該為包含您要分析的文字的資料欄。

  10. 選擇快速建置標準建置以開始建置模型。下列螢幕擷取畫面顯示已就緒,且可以建置的文字預測模型的建置頁面。

    多類別文字預測模型的建置頁面。

模型開始建置後,您可以離開此頁面。當模型在我的模型頁面上顯示為就緒時就可以進行分析和預測。

建置時間序列預測模型

時間序列預測模型支援 Quick BuildsStandard builds

若要建置時間序列預測模型,請使用下列程序:

  1. 開啟 SageMaker Canvas 應用程式。

  2. 在左側導覽窗格中選擇我的模型

  3. 選擇新模型

  4. 建立新的模型對話方塊中,執行下列動作:

    1. 模型名稱欄位中輸入名稱。

    2. 選取時間序列預測問題類型。

    3. 選擇 Create (建立)。

  5. 針對選取資料集,請從資料集清單中選取您的資料集。如果您尚未匯入資料,請選擇匯入以轉向至匯入資料工作流程。

  6. 當您準備好開始建置模型時,請選擇選取資料集

  7. 建置索引標籤的目標欄下拉式清單中,選取您要預測的模型目標。

  8. 模型類型區段中,選擇設定模型

  9. 設定模型方塊隨即開啟。針對時間序列組態區段,請填寫下列欄位:

    1. 針對項目 ID 資料欄 ,選擇資料集中唯一識別每一列的資料欄。

    2. (選用) 針對群組資料欄 ,選擇您要用來分組預測值的一或多個類別資料欄。

    3. 對於時間戳記資料欄 ,選取具有時間戳記的資料欄 (以日期時間格式)。如需可接受日期時間格式的詳細資訊,請參閱 Amazon SageMaker Canvas 中的時間序列預測

    4. 預測長度欄位中,輸入您要預測值的期間。Canvas 會自動偵測資料中的時間單位。

    5. (選用) 開啟使用假日排程切換,以從不同國家選取假日排程,並使用假日資料讓預測更準確。

  10. 設定模型方塊中,進階區段中還有其他設定。如需每個進階設定的詳細資訊,請參閱 進階模型建置組態。若要設定進階設定,請執行下列動作:

    1. 針對目標指標下拉式選單,選取您希望 Canvas 在建置模型時最佳化的指標。如果您未選取指標,Canvas 預設會為您選擇一個指標。如需可用指標的說明,請參閱 指標參考

    2. 如果您正在執行標準建置,您會看到演算法一節。本節用於選取您要用於建置模型的時間序列預測演算法。您可以選取可用演算法的子集,或者如果您不確定要嘗試哪些演算法,則可以選取所有演算法。

      當您執行標準建置時,Canvas 會建置集合模型,將所有演算法結合在一起,以最佳化預測準確性。

      注意

      如果您正在執行快速建置,Canvas 會使用單一樹狀學習演算法來訓練模型,而您不需要選取任何演算法。

    3. 針對預測四分位數 ,輸入最多 5 個逗號分隔的四分位數值,以指定預測的上限和下限。

    4. 設定進階設定後,請選擇儲存

  11. 選取或取消選取資料中的資料欄,以將其包含在建置中或刪除。

    注意

    如果您在建置後使用模型進行批次預測,Canvas 會在預測結果中新增刪除的資料欄。但是,Canvas 不會將刪除的資料欄新增至時間序列模型的批次預測中。

  12. (選用) 使用 Canvas 提供的視覺化和分析工具來視覺化您的資料,並決定您想要在模型中包含哪些功能。如需更多資訊,請參閱探索和分析您的資料

  13. (選用) 使用資料轉換來清理、轉換和準備用於模型建置的資料。如需更多資訊,請參閱使用進階轉換準備資料。您可以選擇模型配方以開啟模型配方側邊面板來檢視和移除轉換。

  14. (選用) 如需其他功能,例如預覽模型的準確性、驗證資料集,以及變更 Canvas 從資料集取得的隨機範例大小,請參閱預覽模型

  15. 檢閱資料並對資料集進行任何變更後,請選擇快速建置標準建置以開始建置您的模型。

模型開始建置後,您可以離開此頁面。當模型在我的模型頁面上顯示為就緒時就可以進行分析和預測。