將 Amazon SageMaker AI 模型與 Amazon 整合 QuickSight - Amazon QuickSight

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

將 Amazon SageMaker AI 模型與 Amazon 整合 QuickSight

注意

您不需要任何機器學習 (ML) 的技術經驗,即可撰寫使用 Amazon 中 ML 功能進行分析和儀表板 QuickSight。

您可以使用 Amazon SageMaker AI 機器學習模型來擴增 Amazon QuickSight Enterprise Edition 資料。您可以在 中存放的資料上執行推論 SPICE 從 Amazon 支援的任何資料來源匯入 QuickSight。如需支援的資料來源的完整清單,請參閱 支援的資料來源

QuickSight 搭配 SageMaker AI 模型使用 Amazon 可以節省您管理資料移動和編寫程式碼所花費的時間。這些結果針對評估模型,以及 (當您滿意結果時) 用於與決策制定者分享都很有用。您可以在建立模型後立即開始。這樣做可以顯示您的資料科學家預先建立的模型,並可讓您將資料科學套用於資料集。然後,您可以在預測儀表板中分享這些深入解析。透過 Amazon QuickSight Serverless 方法,程序可無縫擴展,因此您不需要擔心推論或查詢容量。

Amazon QuickSight 支援使用迴歸和分類演算法的 SageMaker AI 模型。您可以套用此功能,取得幾乎所有商業使用案例的預測。有些範例包括預測客戶流失的可能性、員工流失、評分銷售潛在客戶,以及評估信用風險。若要使用 Amazon QuickSight 提供預測,輸入和輸出的 SageMaker AI 模型資料都必須是表格格式。在多類別或多標籤的分類使用案例中,每個輸出資料欄都必須包含單一值。Amazon QuickSight 不支援單一資料欄中的多個值。

SageMaker AI 整合的運作方式

一般來說,此程序的運作方式如下:

  1. Amazon QuickSight 管理員新增 Amazon QuickSight 存取 SageMaker AI 的許可。若要這樣做,請從管理 QuickSight頁面開啟安全與許可設定。前往 QuickSight 存取 AWS 服務,並新增 SageMaker AI。

    當您新增這些許可時,Amazon QuickSight 會新增至 AWS Identity and Access Management (IAM) 角色,該角色提供列出您 AWS 帳戶中所有 SageMaker AI 模型的存取權。它也提供執行 SageMaker AI 任務的許可,這些任務具有以 開頭的名稱quicksight-auto-generated-

  2. 我們建議您連線到具有推論管道的 SageMaker AI 模型,因為它會自動執行資料預先處理。如需詳細資訊,請參閱 AI 開發人員指南中的部署推論管道SageMaker

  3. 識別資料和您要一起使用的預先訓練模型之後,模型的擁有者會建立並提供結構描述檔案。此JSON檔案是 AI SageMaker 的合約。它提供有關欄位、資料類型、資料欄順序、輸出和模型預期之設定的中繼資料。選用設定元件提供要用於任務的執行個體大小和計算執行個體的計數。

    如果您是建置該模型的資料科學家,請使用下列格式建立此資料結構描述檔案。如果您是模型的使用者,請向模型的擁有者取得結構描述檔案。

  4. 在 Amazon 中 QuickSight,您會先使用要進行預測的資料建立新的資料集。如果您要上傳檔案,您可以在上傳設定畫面上新增 SageMaker AI 模型。否則,您可以在資料準備頁面上新增模型。

    在繼續之前,請確認資料集和模型之間的對應。

  5. 將資料匯入資料集後,輸出欄位會包含從 SageMaker AI 傳回的資料。這些欄位的使用方式與您使用其他欄位的方式相同,請遵循 使用指引 中所述的指導方針。

    當您執行 SageMaker AI 整合時,Amazon 會將請求 QuickSight 傳遞給 SageMaker AI,以使用推論管道執行批次轉換任務。Amazon 會 QuickSight 開始佈建和部署您 AWS 帳戶中所需的執行個體。當處理完成時,這些執行個體會被關閉並終止。運算容量只有在處理模型時才會產生成本。

    為了讓您更輕鬆地識別它們,Amazon 會將其所有 SageMaker AI 任務 QuickSight 命名為字首 quicksight-auto-generated-

  6. 推論的輸出存放在 SPICE 和 附加到資料集。一旦推論完成,您就可以使用資料集來利用預測資料建立視覺效果和儀表板。

  7. 每次儲存資料集時,都會開始重新整理資料。您可以重新整理 來手動啟動資料重新整理程序 SPICE 資料集,或者您可以排定它以定期間隔執行。每次資料重新整理期間,系統會自動呼叫 SageMaker AI 批次轉換,以使用新資料更新輸出欄位。

    您可以使用 Amazon QuickSight SPICE 用於控制資料重新整理程序的擷取API操作。如需使用這些API操作的詳細資訊,請參閱 Amazon QuickSight API 參考

產生的成本 (整合本身無額外成本)

使用此功能本身不需支付額外的費用。您的成本包括下列各項:

  • 透過 SageMaker AI 進行模型部署的成本,只有在模型執行時才會產生。儲存資料集 (在建立或編輯資料集之後) 或重新整理資料之後,就會開始資料擷取程序。如果資料集具有推斷欄位,則此程序包括呼叫 SageMaker AI。成本會衍生在 QuickSight 訂閱所在的相同 AWS 帳戶中。

  • 您的 QuickSight 訂閱成本如下所示:

    • 在 QuickSight () 記憶體內計算引擎中儲存資料的成本SPICE)。 如果您要將新資料新增至 SPICE,您可能需要購買足夠的 SPICE 容量來容納它。

    • QuickSight 適用於建置資料集之作者或管理員的訂閱。

    • Pay-per-session 檢視器 (讀取器) 存取互動式儀表板的費用。

使用指引

在 Amazon 中 QuickSight,下列使用準則適用於此 Enterprise Edition 功能:

  • 模型的處理發生在 SPICE因此,它僅套用至儲存在 中的資料集。SPICE。 程序目前支援每個資料集最多 5 億列。

  • 只有 QuickSight 管理員或作者可以使用 ML 模型增強資料集。讀者只能在他們是儀表板的一部分時檢視結果。

  • 每個資料集僅可以使用確切一個 ML 模型。

  • 輸出欄位不能用來計算新欄位。

  • 資料集不能依與模型整合的欄位篩選。換句話說,如果您的資料集欄位目前映射至 ML 模型,則您無法依該欄位篩選。

在 SageMaker AI 中,下列使用準則適用於您搭配 Amazon 使用的預先訓練模型 QuickSight:

  • 當您建立模型時,請將其與適當IAM角色的 Amazon Resource Name (ARN) 建立關聯。 SageMaker AI 模型IAM的角色需要能夠存取 Amazon 使用的 Amazon S3 儲存貯體。 QuickSight

  • 確定您的模型支援輸入和輸出的 .csv 檔案。確定您的資料是表格格式。

  • 提供包含模型相關中繼資料的結構描述檔案,包括輸入和輸出欄位的清單。目前,您必須手動建立此結構描述檔案。

  • 考量完成推論所需的時間,這取決於許多因素。其中包括模型的複雜性、資料量以及定義的計算容量。完成推論可能需要幾分鐘到幾個小時。Amazon 會將所有資料擷取和推論任務 QuickSight 限制在最長 10 小時。若要減少執行推論所需的時間,請考慮增加執行個體大小或執行個體的數量。

  • 目前,您只能使用批次轉換與 SageMaker AI 整合,不能使用即時資料。您無法使用 SageMaker AI 端點。

定義結構描述檔案

在搭配 Amazon QuickSight 資料使用 SageMaker AI JSON 模型之前,請建立結構描述檔案,其中包含 Amazon 處理模型 QuickSight 所需的中繼資料。Amazon QuickSight 作者或管理員會在設定資料集時上傳結構描述檔案。

結構描述欄位的定義如下。除非在下列說明中有指定,否則所有欄位均為必填欄位。屬性區分大小寫。

inputContentType

此 SageMaker AI 模型預期輸入資料的內容類型。唯一支援的值是 "text/csv"。 QuickSight 不包含您新增至輸入檔案的任何標頭名稱。

outputContentType

您要使用的 SageMaker AI 模型產生的輸出內容類型。此項目唯一支援的值是 "text/csv"

input

模型在輸入資料中預期的功能清單。 會以完全相同的順序 QuickSight 產生輸入資料。此清單包含下列屬性:

  • name:資料欄的名稱。如果可能,將此設定為 QuickSight 與資料集中對應資料欄的名稱相同。此屬性限制為 100 個字元。

  • type:此資料欄的資料類型。此屬性會採用值 "INTEGER""STRING""DECIMAL"

  • nullable:(選用) 欄位的可為 Null 性。預設值為 true。如果您將 nullable設定為 false, 會在呼叫 SageMaker AI 之前 QuickSight 捨棄不包含此值的資料列。這樣做有助於避免 AI SageMaker 在缺少必要資料時失敗。

output

AI SageMaker 模型產生的輸出資料欄清單。 QuickSight 預期這些欄位的順序完全相同。此清單包含下列屬性:

  • name – 此名稱會成為在 中建立之對應新資料欄的預設名稱 QuickSight。您可以覆寫 中在此處指定的名稱 QuickSight。此屬性限制為 100 個字元。

  • type:此資料欄的資料類型。此屬性會採用值 "INTEGER""STRING""DECIMAL"

instanceTypes

AI SageMaker 可以佈建以執行轉換任務的 ML 執行個體類型清單。清單會提供給 QuickSight 使用者以供選擇。此清單僅限於 SageMaker AI 支援的類型。如需支援類型的詳細資訊,請參閱《 AI 開發人員指南TransformResources》中的 。 SageMaker

defaultInstanceType

(選用) 在 SageMaker AI 精靈中顯示為預設選項的執行個體類型 QuickSight。在 instanceTypes 中包含此執行個體類型。

instanceCount

(選用) 執行個體計數會定義要佈建以執行轉換任務的 SageMaker AI 選取執行個體數量。此值必須為正整數。

description

此欄位為擁有 SageMaker AI 模型的人員提供一個位置,以便與使用此模型的人員進行通訊 QuickSight。使用此欄位可提供有關成功使用此模型的提示。例如,此欄位可以包含有關選取有效的執行個體類型,以根據資料集大小從 instanceTypes 中的清單中選擇的資訊。此欄位限制為 1,000 個字元。

version

結構描述的版本,例如 "1.0"

下列範例顯示結構描述檔案中 JSON 的結構。

{ "inputContentType": "CSV", "outputContentType": "CSV", "input": [ { "name": "buying", "type": "STRING" }, { "name": "maint", "type": "STRING" }, { "name": "doors", "type": "INTEGER" }, { "name": "persons", "type": "INTEGER" }, { "name": "lug_boot", "type": "STRING" }, { "name": "safety", "type": "STRING" } ], "output": [ { "name": "Acceptability", "type": "STRING" } ], "description": "Use ml.m4.xlarge instance for small datasets, and ml.m4.4xlarge for datasets over 10 GB", "version": "1.0", "instanceCount": 1, "instanceTypes": [ "ml.m4.xlarge", "ml.m4.4xlarge" ], "defaultInstanceType": "ml.m4.xlarge" }

結構描述檔案的結構與 SageMaker AI 提供的範例中使用的模型類型有關。

將 SageMaker AI 模型新增至 QuickSight 資料集

使用下列程序,您可以將預先訓練的 SageMaker AI 模型新增至資料集,以便在分析和儀表板中使用預測資料。

開始之前,請先準備好下列項目:

  • 您要用來建置資料集的資料。

  • 您想要用來擴增資料集的 SageMaker AI 模型名稱。

  • 模型的結構描述。此結構描述包括欄位名稱對應和資料類型。如果它還包含執行個體類型和要使用的執行個體數量的建議設定,這會很有幫助。

使用 SageMaker AI 擴充 Amazon QuickSight 資料集
  1. 從開始頁面建立新的資料集,方法是選擇資料,然後選擇新增資料集

    您也可以編輯現有的資料集。

  2. 在資料準備畫面上選擇使用 增強 SageMaker

  3. 對於 Select your model (選取您的模型),選擇下列設定:

    • 模型:選擇要用於推斷欄位的 SageMaker AI 模型。

    • 名稱:提供模型的描述名稱。

    • 結構描述 – JSON 上傳為模型提供的結構描述檔案。

    • 進階設定 – QuickSight 根據您的資料集建議選取的預設值。您可以使用特定的執行期設定來平衡任務的速度和成本。若要執行此作業,請輸入執行個體類型的 SageMaker AI ML 執行個體類型,以及計數的執行個體數量。

    選擇 Next (下一步) 繼續。

  4. 針對檢閱輸入,檢閱映射至資料集的欄位。 QuickSight attempts 會自動將結構描述中的欄位映射至資料集中的欄位。如果對應需要調整,您可以在此處進行變更。

    選擇 Next (下一步) 繼續。

  5. 針對檢閱輸出,請檢視新增至您的資料集的欄位。

    選擇 Save and prepare data (儲存並準備資料) 以確認您的選擇。

  6. 若要重新整理資料,請選擇要檢視詳細資料的資料集。然後選擇 Refresh Now (立即重新整理) 以手動重新整理資料,或選擇 Schedule refresh (排程重新整理) 以設定定期的重新整理間隔。每次資料重新整理期間,系統會自動執行 SageMaker AI 批次轉換任務,以使用新資料更新輸出欄位。