Amazon Forecast 不再提供給新客戶。Amazon Forecast 的現有客戶可以繼續正常使用服務。進一步了解"
本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
CreateDatasetImportJob
將您的訓練資料匯入 Amazon Forecast 資料集。您可以在 Amazon Simple Storage Service (Amazon S3) 儲存貯體中提供訓練資料的位置,以及您要匯入資料的資料集的 Amazon Resource Name (ARN)。
重要
Amazon Forecast 不再提供給新客戶。Amazon Forecast 的現有客戶可以繼續正常使用服務。進一步了解"
您必須指定 DataSource 物件,其中包含 Amazon Forecast 可以擔任的 AWS Identity and Access Management (IAM) 角色來存取資料,因為 Amazon Forecast 會複製您的資料並在內部 AWS 系統中處理資料。如需詳細資訊,請參閱設定許可。
訓練資料必須是 CSV 或 Parquet 格式。分隔符號必須是逗號 (,)。
您可以指定特定檔案、S3 儲存貯體或 S3 儲存貯體中資料夾的路徑。對於後兩個案例,Amazon Forecast 會匯入所有檔案,上限為 10,000 個檔案。
由於資料集匯入不會彙總,因此您最新的資料集匯入是訓練預測器或產生預測時使用的資料集匯入。請確定您最近的資料集匯入包含您想要建模的所有資料,而不只是從上一次匯入以來所收集的新資料。
若要取得所有資料集匯入任務的清單,依指定的條件篩選,請使用 ListDatasetImportJobs 操作。
請求語法
{
"DatasetArn": "string
",
"DatasetImportJobName": "string
",
"DataSource": {
"S3Config": {
"KMSKeyArn": "string
",
"Path": "string
",
"RoleArn": "string
"
}
},
"Format": "string
",
"GeolocationFormat": "string
",
"ImportMode": "string
",
"Tags": [
{
"Key": "string
",
"Value": "string
"
}
],
"TimestampFormat": "string
",
"TimeZone": "string
",
"UseGeolocationForTimeZone": boolean
}
請求參數
請求接受採用 JSON 格式的下列資料。
- DatasetArn
-
您要匯入資料的 Amazon Forecast 資料集的 Amazon Resource Name (ARN)。
類型:字串
長度限制:長度上限為 256。
模式:
arn:([a-z\d-]+):forecast:.*:.*:.+
必要:是
- DatasetImportJobName
-
資料集匯入任務的名稱。我們建議您在名稱中包含目前的時間戳記,例如
20190721DatasetImport
。這可協助您避免取得ResourceAlreadyExistsException
例外狀況。類型:字串
長度限制:長度下限為 1。長度上限為 63。
模式:
^[a-zA-Z][a-zA-Z0-9_]*
必要:是
- DataSource
-
要匯入的訓練資料位置和 AWS Identity and Access Management (IAM) 角色,Amazon Forecast 可以擔任該角色來存取資料。訓練資料必須存放在 Amazon S3 儲存貯體中。
如果使用加密,
DataSource
必須包含 AWS Key Management Service (KMS) 金鑰,且 IAM 角色必須允許 Amazon Forecast 存取金鑰。KMS 金鑰和 IAM 角色必須符合 CreateDataset 操作的EncryptionConfig
參數中指定的金鑰和 IAM 角色。類型:DataSource 物件
必要:是
- Format
-
匯入資料的格式,CSV 或 PARQUET。預設值為 CSV。
類型:字串
長度限制:長度上限為 7。
模式:
^CSV|PARQUET$
必要:否
- GeolocationFormat
-
地理位置屬性的格式。地理位置屬性的格式有兩種:
-
LAT_LONG
- 十進位格式的緯度和經度 (範例:47.61_-122.33)。 -
CC_POSTALCODE
(僅限美國) - 國家/地區碼 (美國),後面接著 5 位數郵遞區號 (範例:US_98121)。
類型:字串
長度限制:長度上限為 256。
模式:
^[a-zA-Z0-9_]+$
必要:否
-
- ImportMode
-
指定資料集匯入任務是
FULL
還是INCREMENTAL
匯入。FULL
資料集匯入會將所有現有資料取代為新匯入的資料。INCREMENTAL
匯入會將匯入的資料附加至現有資料。類型:字串
有效值:
FULL | INCREMENTAL
必要:否
- Tags
-
您套用至資料集匯入任務的選用中繼資料,可協助您分類和組織這些中繼資料。每個標籤皆包含由您定義的一個金鑰與一個選用值。
以下基本限制適用於標籤:
-
每個資源的標籤數量上限 - 50。
-
對於每一個資源,每個標籤金鑰必須是唯一的,且每個標籤金鑰只能有一個值。
-
金鑰長度上限 - UTF-8 中的 128 個 Unicode 字元。
-
最大值長度 - UTF-8 中的 256 個 Unicode 字元。
-
如果您的標記結構描述是跨多項服務和資源使用,請記得其他服務可能會有字元使用限制。通常允許的字元包括:可用 UTF-8 表示的英文字母、數字和空格,還有以下字元:+ - = . _ : / @。
-
標籤鍵與值皆區分大小寫。
-
請勿使用
aws:
、AWS:
或任何大寫或小寫的組合,例如保留供 AWS 使用的金鑰字首。您無法編輯或刪除具有此字首的標籤索引鍵。值可以有此字首。如果標籤值具有aws
作為其字首,但金鑰沒有,則預測會將其視為使用者標籤,並將計入 50 個標籤的限制。僅包含 金鑰字首的標籤aws
不會計入每個資源限制的標籤。
類型:Tag 物件陣列
陣列成員:項目數下限為 0。項目數上限為 200。
必要:否
-
- TimestampFormat
-
資料集中的時間戳記格式。您指定的格式取決於建立資料集時
DataFrequency
指定的 。支援下列格式-
"yyyy-MM-dd"
對於下列資料頻率:Y、M、W 和 D
-
"yyyy-MM-dd HH:mm:ss"
對於下列資料頻率:H、30 分鐘、15 分鐘和 1 分鐘;以及選擇性的 Y、M、W 和 D
如果未指定格式,Amazon Forecast 預期格式為 "yyyy-MM-dd HH:mm:ss"。
類型:字串
長度限制:長度上限為 256。
模式:
^[a-zA-Z0-9\-\:\.\,\'\s]+$
必要:否
-
- TimeZone
-
資料集中每個項目的單一時區。此選項非常適合具有單一時區內所有時間戳記的資料集,或將所有時間戳記標準化為單一時區。
如需有效時區名稱的完整清單,請參閱 Joda-Time API
。 類型:字串
長度限制:長度上限為 256。
模式:
^[a-zA-Z0-9\/\+\-\_]+$
必要:否
- UseGeolocationForTimeZone
-
從地理位置屬性自動衍生時區資訊。此選項適用於在多個時區包含時間戳記的資料集,這些時間戳記以本機時間表示。
類型:布林值
必要:否
回應語法
{
"DatasetImportJobArn": "string"
}
回應元素
如果動作成功,則服務傳回 HTTP 200 回應。
服務會傳回下列 JSON 格式的資料。
- DatasetImportJobArn
-
資料集匯入任務的 Amazon Resource Name (ARN)。
類型:字串
長度限制:長度上限為 256。
模式:
arn:([a-z\d-]+):forecast:.*:.*:.+
錯誤
- InvalidInputException
-
我們無法處理請求,因為它包含無效值或超過有效範圍的值。
HTTP 狀態碼:400
- LimitExceededException
-
已超過每個帳戶的資源數量限制。
HTTP 狀態碼:400
- ResourceAlreadyExistsException
-
已有具有此名稱的資源。請用不同的名稱再試一次。
HTTP 狀態碼:400
- ResourceInUseException
-
指定的資源正在使用中。
HTTP 狀態碼:400
- ResourceNotFoundException
-
我們找不到具有該 Amazon Resource Name (ARN) 的資源。請檢查 ARN,然後再試一次。
HTTP 狀態碼:400
另請參閱
如需在其中一種語言特定 AWS SDKs中使用此 API 的詳細資訊,請參閱下列內容: