建立 ML 模型 - Amazon Machine Learning

我們不再更新 Amazon Machine Learning 服務或接受新使用者。本文件適用於現有使用者,但我們不再對其進行更新。如需詳細資訊,請參閱什麼是 Amazon Machine Learning

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

建立 ML 模型

建立資料來源之後,您可以開始建立 ML 模型。如果您使用 Amazon Mault (學習) 主控台來建立模型,您可以選擇使用預設設定,或透過套用自訂選項來自訂您的模型。

自訂選項包括:

  • 評估設置:您可以選擇讓 Amazon ML 預留一部分的輸入資料,以評估 ML 模型的預測品質。如需評估的資訊,請參閱評估 ML 模型

  • 一個配方:此配方會告訴 Amazon ML 有哪些屬性與屬性轉換可用於模型定型。如需亞馬遜 ML 配方的詳細資訊,請參使用資料配方轉換特徵

  • 培訓參數:這些參數可控制定型程序與所產生之 ML 模型的特定屬性。如需定型參數的詳細資訊,請參閱定型參數

若要選取或指定這些設定的值,請在使用 Create ML Model (建立 ML 模型) 精靈時選擇 Custom (自訂) 選項。若要讓 Amazon ML 套用預設設定,請選擇預設值

當您建立 ML 模型時,Amazon ML 會根據您目標屬性的屬性類型,選取所要使用的學習演算法類型 (目標屬性是包含「正確」答案的屬性)。如果您的目標屬性是二元,Amazon ML 會建立一個使用羅吉斯迴歸演算法的二元分類模型。如果您的目標屬性是分類,Amazon ML 會建立一個使用多維度羅吉斯迴歸演算法的多類別模型。如果您的目標屬性是數值,Amazon ML 會建立一個使用線性迴歸演算法的迴歸模型。

先決條件

使用 Amazon ML 主控台來建立 ML 模型之前,您需要建立兩個資料來源,一個用於定型模型,另一個用於評估模型。如果您尚未建立兩個資料來源,請參閱本教學課程中的步驟 2:建立訓練資料來源

使用預設選項建立 ML 模型

選擇預設值如果您要讓亞馬遜 ML 執行下列操作:

  • 分割輸入資料,將前 70% 用於定型,並將剩餘的 30% 用於評估

  • 以定型資料來源上所收集的統計資料為基礎的建議配方,其為輸入資料來源的 70%

  • 選擇預設定型參數

選擇預設選項
  1. 在 Amazon ML 主控台,選擇Amazon Machine Learning,然後選擇ML 模型

  2. ML models (ML 模型) 摘要頁面上,選擇 Create a new ML model (建立新的 ML 模型)

  3. Input data (輸入資料) 頁面上,確定已選取 I already created a datasource pointing to my S3 data (我已建立指向我的 S3 資料的資料來源)

  4. 在資料表中,選擇您的資料來源,然後選擇 Continue (繼續)

  5. ML model settings (ML 模型設定) 頁面上,於 ML model name (ML 模型名稱) 輸入您的 ML 模型的名稱。

  6. 針對 Training and evaluation settings (定型與評估設定),確定已選取 Default (預設)

  7. 適用於命名此評估,輸入評估的名稱,然後選擇檢閱。Amazon ML 會略過精靈的其餘部分,並帶您進入檢閱(憑證已建立!) 頁面上的名稱有些許差異。

  8. 檢閱您的資料,刪除您從資料來源複製但不想要套用至模型與評估的任何標籤,然後選擇 Finish (完成)

使用自訂選項建立 ML 模型

自訂 ML 模型可讓您:

  • 提供您自己的配方。如需如何提供您自己的配方的資訊,請參閱配方格式參考

  • 選擇定型參數。如需定型參數的詳細資訊,請參閱定型參數

  • 選擇預設 70/30 比例以外的定型/評估分割比例,或提供另一個已準備好評估的資料來源。如需分割策略的資訊,請參閱分割您的資料

您也可以針對任何這些設定選擇預設值。

如果您已使用預設選項建立模型,並想要改善模型的預測效能,請使用 Custom (自訂) 選項建立具有一些自訂設定的新模型。例如,您可以將更多特徵轉換新增至配方,以增加定型參數中的傳遞數目。

使用自訂選項建立模型
  1. 在 Amazon ML 主控台,選擇Amazon Machine Learning,然後選擇ML 模型

  2. ML models (ML 模型) 摘要頁面上,選擇 Create a new ML model (建立新的 ML 模型)

  3. 如果您已建立資料來源,請在 Input data (輸入資料) 頁面上,選擇 I already created a datasource pointing to my S3 data (我已建立指向我的 S3 資料的資料來源)。在資料表中,選擇您的資料來源,然後選擇 Continue (繼續)

    如果您需要建立資料來源,請選擇 My data is in S3, and I need to create a datasource (我的資料在 S3 中,而且我需要建立資料來源),然後選擇 Continue (繼續)。系統會將您重新導向至 Create a Datasource (建立資料來源) 精靈。指定您的資料是在 S3Redshift 中,然後選擇 Verify (驗證)。完成建立資料來源的程序。

    建立資料來源之後,系統會將您重新導向至 Create ML Model (建立 ML 模型) 精靈的下一個步驟。

  4. ML model settings (ML 模型設定) 頁面上,於 ML model name (ML 模型名稱) 輸入您的 ML 模型的名稱。

  5. Select training and evaluation settings (選取定型與評估設定) 中選擇 Custom (自訂),然後選擇 Continue (繼續)

  6. Recipe (配方) 頁面上,您可以customize a recipe。如果您不想要自訂配方,Amazon ML 會為您建議一個配方。選擇 Continue (繼續)

  7. Advanced settings (進階設定) 頁面上,指定 Maximum ML model Size (最大 ML 模型大小)Maximum number of data passes (最大資料傳遞數目)Shuffle type for training data (培訓資料的隨機播放類型)Regularization type (正規化類型)Regularization amount (正規化數量)。如果您未指定這些選項,Amazon ML 會使用預設的定型參數。

    如需這些參數與其預設值的詳細資訊,請參閱培訓參數

    選擇 Continue (繼續)

  8. Evaluation (評估) 頁面上,指定您是否要立即評估 ML 模型。如果您不想要立即評估 ML 模型,請選擇 Review (檢閱)

    如果您想要立即評估 ML 模型:

    1. 針對 Name this evaluation (命名此評估) 輸入評估的名稱。

    2. 適用於選取評估資料下,選擇您是否要讓 Amazon ML 預留一部分的輸入資料進行評估;若是的話,您要如何分割資料來源,或是選擇不同的資料來源進行評估。

    3. 選擇 Review (檢閱)

  9. Review (檢閱) 頁面上,編輯您的選擇,刪除您從資料來源複製但不想要套用至模型與評估的任何標籤,然後選擇 Finish (完成)

建立模型之後,請參閱步驟 4:檢 ML 模型的預測效能並設定分數閾值