

要获得与亚马逊 Timestream 类似的功能 LiveAnalytics，可以考虑适用于 InfluxDB 的亚马逊 Timestream。适用于 InfluxDB 的 Amazon Timestream 提供简化的数据摄取和个位数毫秒级的查询响应时间，以实现实时分析。点击[此处](https://docs.aws.amazon.com//timestream/latest/developerguide/timestream-for-influxdb.html)了解更多信息。

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 使用控制台进行批量加载
<a name="batch-load-using-console"></a>

以下是使用 AWS 管理控制台进行批量加载的步骤。您可以通过[示例 CSV](samples/batch-load-sample-file.csv.zip) 下载示例 CSV。

**Topics**
+ [访问批量加载](#console_timestream.access-batch-load.using-console)
+ [创建批量加载任务](#console_timestream.create-batch-load.using-console)
+ [恢复批量加载任务](#console_timestream.resume-batch-load.using-console)
+ [使用可视化生成器](#batch-load-using-visual-builder)

## 访问批量加载
<a name="console_timestream.access-batch-load.using-console"></a>

按照以下步骤，使用 AWS 管理控制台访问批量加载。

1. 打开 [Amazon Timestream 控制台](https://console.aws.amazon.com/timestream)。

1. 在导航窗格中，选择**管理工具**，然后选择**批量加载任务**。

1. 在此处，您可以查看批量加载任务列表，并深入研究特定任务以获取更多详细信息。您还可以创建和恢复任务。

## 创建批量加载任务
<a name="console_timestream.create-batch-load.using-console"></a>

按照以下步骤，使用 AWS 管理控制台创建批量加载任务。

1. 打开 [Amazon Timestream 控制台](https://console.aws.amazon.com/timestream)。

1. 在导航窗格中，选择**管理工具**，然后选择**批量加载任务**。

1. 选择**创建批量加载任务**。

1. 在**导入目标**中，选择以下选项。
   + **目标数据库**：选择在 [创建数据库](console_timestream.md#console_timestream.db.using-console) 中创建的数据库名称。
   + **目标表**：选择在 [创建表](console_timestream.md#console_timestream.table.using-console) 中创建的表名称。

   如有必要，可使用**创建新表**按钮，从此面板添加表。

1. 从**数据来源**中的**数据来源 S3 位置**，选择存储源数据的 S3 存储桶。使用 “**浏览 S3**” 按钮查看活动 AWS 账户有权访问的 S3 资源，或者输入 S3 位置 URL。数据来源必须位于同一区域中。

1. 在**文件格式设置**（可展开部分）中，可使用默认设置解析输入数据。您也可以选择**高级设置**。从此处，您可以选择 **CSV 格式参数**，然后选择参数以解析输入数据。有关这些参数的信息，请参阅[CSV 格式参数](batch-load-preparing-data-file.md#batch-load-data-file-options)。

1. 在**配置数据模型映射**中，配置数据模型。有关其他数据模型指南，请参阅[批量加载的数据模型映射](batch-load-data-model-mappings.md)
   + 在**数据模型映射**中，选择**映射配置输入**，然后选择以下选项之一。
     + **可视化生成器**-要直观地映射数据，请选择**TargetMultiMeasureName**或**MeasureNameColumn**。然后从**可视化生成器**中，映射列。

       当选择单个 CSV 文件作为数据来源时，可视化生成器会自动检测并加载数据来源文件中的源列标题。选择要创建映射的属性及数据类型。

       有关使用可视化生成器的信息，请参阅[使用可视化生成器](#batch-load-using-visual-builder)。
     + **JSON 编辑器**：用于配置数据模型的自由格式 JSON 编辑器。如果您熟悉 Timestream， LiveAnalytics 并且想要构建高级数据模型映射，请选择此选项。
     + **来自 S3 的 JSON 文件**：选择存储在 S3 中的 JSON 模型文件。如果您已配置数据模型并希望将其重复用于其他批量加载，请选择此选项。

1. 在**错误日志报告**的**错误日志 S3 位置**中，选择用于报告错误的 S3 位置。有关如何使用此报告的信息，请参阅[使用批量加载错误报告](batch-load-using-error-reports.md)。

1. 对于**加密密钥类型**，选择下列选项之一。
   + **Amazon S3 托管密钥（SSE-S3）**：Amazon S3 创建、管理和使用的加密密钥。
   + **AWS KMS key (SSE-KMS)**-受 AWS Key Management Service (AWS KMS) 保护的加密密钥。

1. 选择**下一步**。

1. 在**审核和创建页面**上，根据需要审核并编辑设置。
**注意**  
批量加载任务创建后，无法更改批量加载任务设置。任务完成时间将根据导入的数据量而有所不同。

1. 选择**创建批量加载任务**。

## 恢复批量加载任务
<a name="console_timestream.resume-batch-load.using-console"></a>

当选择状态为“进度已停止”且仍可恢复的批量加载任务时，系统会提示您恢复该任务。查看这些任务的详细信息时，还会显示一个带有**恢复任务**按钮的横幅。可恢复任务设有“恢复截止日期”。该日期到期后，任务将无法恢复。

## 使用可视化生成器
<a name="batch-load-using-visual-builder"></a>

您可以使用可视化生成器将存储在 S3 存储桶中的一个或多个 CSV 文件源数据列映射到 LiveAnalytics 表的 Timestream 中的目标列。

**注意**  
您的角色需要文件的 `SelectObjectContent` 权限。否则，您将需要手动添加或删除列。

### 自动加载源列模式
<a name="batch-load-using-visual-builder-auto-load"></a>

如果您只指定一个存储桶，Timestream for LiveAnalytics 可以自动扫描源 CSV 文件中的列名。如果没有现有的映射，则可以选择**导入源列**。

1. 从**映射配置输入设置**中选择**可视化生成器**选项，设置时间戳时间输入。`Milliseconds` 为默认设置。

1. 点击**加载源列**按钮，以导入源数据文件中的列标题。该表将使用数据来源文件中的源列标题名称进行填充。

1. 为每个源列选择**目标表列名**、**Timestream 属性类型**和**数据类型**。

   有关这些列和可能值的详细信息，请参阅[映射字段](#batch-load-using-visual-builder-mapping-fields)。

1. 使用该 drag-to-fill功能一次性设置多列的值。

### 手动添加源列
<a name="batch-load-using-visual-builder-manually-add"></a>

如果您使用的是存储桶或 CSV 前缀，而非单个 CSV，则可以使用**添加列映射**和**删除列映射**按钮，通过可视化编辑器添加和删除列映射。还有一个用于重置映射的按钮。

### 映射字段
<a name="batch-load-using-visual-builder-mapping-fields"></a>
+ **源列名称**：源文件中表示要导入的度量的列名称。当您使用**导**入源列时，Timestream LiveAnalytics 可以自动填充此值。
+ **目标表列名**：可选输入，用于指示目标表中度量的列名。
+ **Timestream 属性类型**：指定源列中数据的属性类型，例如 `DIMENSION`。
  + **TIMESTAMP**：指定何时收集度量。
  + **MULTI**：表示多个度量。
  + **DIMENSION**：时间序列元数据。
  + **MEASURE\$1NAME**：对于单度量记录，这是度量名称。
+ **数据类型**：Timestream 列的类型，例如 `BOOLEAN`。
  + **BIGINT**：64 位整数。
  + **BOOLEAN**：逻辑的两个真值：true 和 false。
  + **DOUBLE**：64 位可变精度数值。
  + **TIMESTAMP**：使用 UTC 纳秒级精度的时点实例，用于跟踪自 Unix epoch 以来的时间。