批次預測資料集需求 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

批次預測資料集需求

針對批次預測,請確定您的資料集符合建立資料集中所述的需求。如果您的資料集大於 5 GB,則 Canvas 會使用 Amazon EMR Serverless 來處理您的資料並分割成較小的批次。分割資料後,Canvas 會使用 SageMaker 批次轉換進行預測。執行批次預測後,您可能會看到這兩種服務的費用。如需詳細資訊,請參閱 Canvas 定價

如果某些資料集具有不相容的結構描述 ,則可能無法對這些資料集進行預測。結構描述是一種組織結構。針對表格式資料集,結構描述是資料欄的名稱和資料欄中資料的資料類型。不相容的結構描述可能的發生原因如下:

  • 您用來進行預測的資料集具有的資料欄少於您用來建立模型的資料集。

  • 您用來建立資料集的資料欄資料類型,可能與您用來進行預測的資料集中的資料類型不同。

  • 您用來進行預測的資料集,以及用來建置模型的資料集中資料欄名稱不相符。欄位名稱區分大小寫,Column1 不同於 column1

為了確保您可以成功產生批次預測,請比對批次預測資料集的結構描述與用於訓練模型的資料集。

注意

針對批次預測,如果您在建置模型時捨棄任何欄,Canvas 會將捨棄的欄新增回預測結果。但是,Canvas 不會將刪除的資料欄新增至時間序列模型的批次預測中。