

 Amazon Forecast 不再向新买家开放。Amazon Forecast 的现有客户可以继续照常使用该服务。[了解更多](https://aws.amazon.com/blogs/machine-learning/transition-your-amazon-forecast-usage-to-amazon-sagemaker-canvas/)

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# CreateDataset
<a name="API_CreateDataset"></a>

创建 Amazon Forecast 数据集。

**重要**  
Amazon Forecast 已不再向新买家开放。Amazon Forecast 的现有客户可以继续照常使用该服务。[了解更多](https://aws.amazon.com/blogs/machine-learning/transition-your-amazon-forecast-usage-to-amazon-sagemaker-canvas/) 

您提供的有关数据集的信息可帮助 Forecast 了解如何使用数据进行模型训练。这包括以下这些：
+  * `DataFrequency` * - 收集历史时间序列数据的频率。
+  * `Domain` * 和 * `DatasetType` * - 每个数据集都有一个关联的数据集域和域内的类型。Amazon Forecast 提供预定义域和每个域中类型的列表。对于每个唯一的数据集域及域内的类型，Amazon Forecast 要求您的数据包含最小的预定义字段集。
+  * `Schema` * - 架构指定数据集中的字段，包括字段名称和数据类型。

在创建数据集后，将您的训练数据导入其中并将数据集添加到数据集组。您使用数据集组来创建预测器。有关更多信息，请参阅[导入数据集](https://docs.aws.amazon.com/forecast/latest/dg/howitworks-datasets-groups.html)。

要获取所有数据集的列表，请使用[ListDatasets](https://docs.aws.amazon.com/forecast/latest/dg/API_ListDatasets.html)操作。

有关预测数据集的示例，请参阅 [Amazon Forecas GitHub t 示例存储库](https://github.com/aws-samples/amazon-forecast-samples)。

**注意**  
在可以导入训练数据之前，数据集的 `Status` 必须为 `ACTIVE`。使用 [DescribeDataset](https://docs.aws.amazon.com/forecast/latest/dg/API_DescribeDataset.html) 操作获取此状态。

## 请求语法
<a name="API_CreateDataset_RequestSyntax"></a>

```
{
   "DataFrequency": "string",
   "DatasetName": "string",
   "DatasetType": "string",
   "Domain": "string",
   "EncryptionConfig": { 
      "KMSKeyArn": "string",
      "RoleArn": "string"
   },
   "Schema": { 
      "Attributes": [ 
         { 
            "AttributeName": "string",
            "AttributeType": "string"
         }
      ]
   },
   "Tags": [ 
      { 
         "Key": "string",
         "Value": "string"
      }
   ]
}
```

## 请求参数
<a name="API_CreateDataset_RequestParameters"></a>

请求接受采用 JSON 格式的以下数据。

 ** [DataFrequency](#API_CreateDataset_RequestSyntax) **   <a name="forecast-CreateDataset-request-DataFrequency"></a>
数据收集的频率。此参数对于 RELATED\$1TIME\$1SERIES 数据集为必需。  
有效间隔为一个整数，后跟 Y（年）、M（月）、W（周）、D（日）、H（小时）和 min（分钟）。例如，“1D”表示每天，“15min”表示每 15 分钟。不能指定与下一个较大频率重叠的值。例如，这意味着您不能将频率指定为 60 分钟，因为这相当于 1 小时。每个频率的有效值如下所示：  
+ 分钟 - 1-59
+ 小时 - 1-23
+ 天 - 1-6
+ 周 - 1-4
+ 月 - 1-11
+ 年 - 1
因此，如果您想要每隔一周进行一次预测，请指定“2W”。或者，如果您想要每季度预测一次，请指定“3M”。  
类型：字符串  
长度限制：最小长度为 1。最大长度为 5。  
模式：`^Y|M|W|D|H|30min|15min|10min|5min|1min$`  
必需：否

 ** [DatasetName](#API_CreateDataset_RequestSyntax) **   <a name="forecast-CreateDataset-request-DatasetName"></a>
数据集的名称。  
类型：字符串  
长度限制：最小长度为 1。最大长度为 63。  
模式：`^[a-zA-Z][a-zA-Z0-9_]*`  
是否必需：是

 ** [DatasetType](#API_CreateDataset_RequestSyntax) **   <a name="forecast-CreateDataset-request-DatasetType"></a>
数据集类型。有效值取决于选定的 `Domain`。  
类型：字符串  
有效值：`TARGET_TIME_SERIES | RELATED_TIME_SERIES | ITEM_METADATA`  
是否必需：是

 ** [Domain](#API_CreateDataset_RequestSyntax) **   <a name="forecast-CreateDataset-request-Domain"></a>
与数据集关联的域。将数据集添加到数据集组时，此值和为[CreateDatasetGroup](https://docs.aws.amazon.com/forecast/latest/dg/API_CreateDatasetGroup.html)操作`Domain`参数指定的值必须匹配。  
您选择的 `Domain` 和 `DatasetType` 决定导入到数据集的训练数据中必须存在的字段。例如，如果您选择 `RETAIL` 域和 `TARGET_TIME_SERIES` 作为 `DatasetType`，Amazon Forecast 要求数据中存在 `item_id`、`timestamp` 和 `demand` 字段。有关更多信息，请参阅[导入数据集](https://docs.aws.amazon.com/forecast/latest/dg/howitworks-datasets-groups.html)。  
类型：字符串  
有效值：`RETAIL | CUSTOM | INVENTORY_PLANNING | EC2_CAPACITY | WORK_FORCE | WEB_TRAFFIC | METRICS`  
是否必需：是

 ** [EncryptionConfig](#API_CreateDataset_RequestSyntax) **   <a name="forecast-CreateDataset-request-EncryptionConfig"></a>
一个 AWS Key Management Service (KMS) 密钥和 AWS Identity and Access Management (IAM) 角色，Amazon Forecast 可以代入该密钥访问该密钥。  
类型：[EncryptionConfig](API_EncryptionConfig.md) 对象  
必需：否

 ** [Schema](#API_CreateDataset_RequestSyntax) **   <a name="forecast-CreateDataset-request-Schema"></a>
数据集的架构。架构属性及其顺序必须与数据中的字段匹配。您选择的数据集 `Domain` 和 `DatasetType` 可确定训练数据所需的最少字段。有关特定数据集域和类型所需字段的信息，请参阅[数据集域和数据集类型](https://docs.aws.amazon.com/forecast/latest/dg/howitworks-domains-ds-types.html)。  
类型：[Schema](API_Schema.md) 对象  
是否必需：是

 ** [Tags](#API_CreateDataset_RequestSyntax) **   <a name="forecast-CreateDataset-request-Tags"></a>
您应用于数据集以帮助您对其进行分类和组织的可选元数据。每个标签都包含定义的一个键和一个可选值。  
下面是适用于 标签的基本限制：  
+ 每个资源的最大标签数 - 50。
+ 对于每个资源，每个标签键必须是唯一的，并且每个标签键只能有一个值。
+ 最大键长度 - 128 个 Unicode 字符（采用 UTF-8 格式）。
+ 最大值长度 - 256 个 Unicode 字符（采用 UTF-8 格式）。
+ 如果您的标记模式针对多个服务和资源使用，请记得其它服务可能对允许使用的字符有限制。通常允许使用的字符包括：可用 UTF-8 格式表示的字母、数字和空格，以及以下字符：\$1：= . \$1 : / @。
+ 标签键和值区分大小写。
+ 请勿使用`aws:``AWS:`、或任何大写或小写组合，例如密钥的前缀，因为它是保留供 AWS 使用的。不能编辑或删除带此前缀的标签键。值可以带有该前缀。如果标签值将 `aws` 作为其前缀，但键没有前缀，则 Forecast 会将其视为用户标签，并将计入 50 个标签的限制。仅具有 `aws` 的键前缀的标签不计入每个资源的标签数限制。
类型：[Tag](API_Tag.md) 对象数组  
数组成员：最少 0 个物品。最多 200 项。  
必需：否

## 响应语法
<a name="API_CreateDataset_ResponseSyntax"></a>

```
{
   "DatasetArn": "string"
}
```

## 响应元素
<a name="API_CreateDataset_ResponseElements"></a>

如果此操作成功，则该服务将会发送回 HTTP 200 响应。

服务以 JSON 格式返回以下数据。

 ** [DatasetArn](#API_CreateDataset_ResponseSyntax) **   <a name="forecast-CreateDataset-response-DatasetArn"></a>
数据集的 Amazon 资源名称（ARN）。  
类型：字符串  
长度约束：最大长度为 256。  
模式：`arn:([a-z\d-]+):forecast:.*:.*:.+`

## 错误
<a name="API_CreateDataset_Errors"></a>

 ** InvalidInputException **   
我们无法处理该请求，因为其包含无效值或超出有效范围的值。  
HTTP 状态代码：400

 ** LimitExceededException **   
超过了每个账户的资源数量限制。  
HTTP 状态代码：400

 ** ResourceAlreadyExistsException **   
已存在同名资源。请使用不同的名称重试。  
HTTP 状态代码：400

## 另请参阅
<a name="API_CreateDataset_SeeAlso"></a>

有关以特定语言之一使用此 API 的更多信息 AWS SDKs，请参阅以下内容：
+  [AWS 命令行界面 V2](https://docs.aws.amazon.com/goto/cli2/forecast-2018-06-26/CreateDataset) 
+  [AWS 适用于.NET 的 SDK V4](https://docs.aws.amazon.com/goto/DotNetSDKV4/forecast-2018-06-26/CreateDataset) 
+  [AWS 适用于 C\$1\$1 的 SDK](https://docs.aws.amazon.com/goto/SdkForCpp/forecast-2018-06-26/CreateDataset) 
+  [AWS 适用于 Go v2 的 SDK](https://docs.aws.amazon.com/goto/SdkForGoV2/forecast-2018-06-26/CreateDataset) 
+  [AWS 适用于 Java 的 SDK V2](https://docs.aws.amazon.com/goto/SdkForJavaV2/forecast-2018-06-26/CreateDataset) 
+  [AWS JavaScript V3 版软件开发工具包](https://docs.aws.amazon.com/goto/SdkForJavaScriptV3/forecast-2018-06-26/CreateDataset) 
+  [AWS 适用于 Kotlin 的 SDK](https://docs.aws.amazon.com/goto/SdkForKotlin/forecast-2018-06-26/CreateDataset) 
+  [AWS 适用于 PHP 的 SDK V3](https://docs.aws.amazon.com/goto/SdkForPHPV3/forecast-2018-06-26/CreateDataset) 
+  [AWS Python 软件开发工具包](https://docs.aws.amazon.com/goto/boto3/forecast-2018-06-26/CreateDataset) 
+  [AWS 适用于 Ruby V3 的 SDK](https://docs.aws.amazon.com/goto/SdkForRubyV3/forecast-2018-06-26/CreateDataset) 