配置目的地设置 - Amazon Data Firehose

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

配置目的地设置

本节介绍了您必须根据所选目的地设置为 Firehose 流配置的设置。

为 Amazon S3 配置目的地设置

您必须指定以下设置,才能使用 Amazon S3 作为 Firehose 流的目的地。

  • 输入以下字段的值。

    S3 bucket

    请选择一个您拥有的用于接收流数据的 S3 存储桶。您可以创建一个新 S3 存储桶或选择现有的 S3 存储桶。

    新行分隔符

    您可以配置 Firehose 流,在传输到 Amazon S3 的对象的记录之间添加新行分隔符。为此,请选择启用。若不在传输到 Amazon S3 的对象中的记录之间添加新行分隔符,请选择禁用。如果您计划使用 Athena 来查询包含聚合记录的 S3 对象,则请启用此选项。

    动态分区

    选择启用以启用和配置动态分区。

    多记录解聚

    多记录解聚是解析 Firehose 流中的记录,并根据有效的 JSON 或指定的换行符分隔记录的过程。

    如果您将多个事件、日志或记录聚合到单个 PutRecord 和 PutRecordBatch API 调用中,则仍然可以启用和配置动态分区。对于聚合数据,启用动态分区时,Amazon Data Firehose 会解析记录,并在每次 API 调用中查找多个有效的 JSON 对象。将 Firehose 流配置为使用 Kinesis Data Stream 作为源时,您还可以使用 Kinesis Producer Library(KPL)中的内置聚合。数据分区功能在数据解聚后执行。因此,每次 API 调用中的每条记录都可以传输到不同的 Amazon S3 前缀。您还可以利用 Lambda 函数集成,在数据分区功能之前执行任何其他解聚或转换。

    重要

    如果数据是聚合的,则只有在执行数据解聚后才能应用动态分区。因此,如果您对聚合数据启用动态分区,则必须选择启用才能启用多记录解聚。

    Firehose 流按以下顺序执行处理步骤:KPL(protobuf)解聚、JSON 或分隔符解聚、Lambda 处理、数据分区、数据格式转换和 Amazon S3 传输。

    多记录解聚类型

    如果您启用了多记录解聚,则必须指定 Firehose 解聚数据的方法。使用下拉菜单选择 JSON分隔

    内联解析

    内联解析是一种受支持的机制,可以对发往 Amazon S3 的数据进行动态分区。要使用内联解析对数据进行动态分区,则必须指定要用作分区键的数据记录参数,并为每个指定的分区键提供一个值。选择启用以启用和配置内联解析。

    重要

    如果您在上述步骤中指定了 AWS Lambda 函数来转换源记录,则可以使用此函数对绑定到 S3 的数据进行动态分区,并且仍然可以通过内联解析创建分区密钥。通过动态分区,您可以使用内联解析或 Lambd AWS a 函数来创建分区密钥。或者,您可以同时使用内联解析和 Lamb AWS da 函数来创建分区密钥。

    动态分区键

    您可以使用字段指定用作动态分区键的数据记录参数,并使用 jq 查询生成动态分区键值。Firehose 仅支持 jq 1.6。您最多可以指定 50 个动态分区键。您必须为动态分区键值输入有效的 jq 表达式,才能成功为 Firehose 流配置动态分区。

    S3 存储桶前缀

    启用和配置动态分区后,必须指定 S3 存储桶前缀,Amazon Data Firehose 要向该存储桶传输分区数据。

    为了正确配置动态分区,S3 存储桶前缀的数量必须与指定分区键的数量相同。

    您可以使用内联解析或指定的 Lambd AWS a 函数对源数据进行分区。如果您指定了 AWS Lambda 函数来为源数据创建分区密钥,则必须使用以下格式手动键入 S3 存储桶前缀值:“Lambda: keyID” partitionKeyFrom。如果您使用内联解析为源数据指定分区密钥,则可以使用以下格式手动键入 S3 存储桶预览值:“partitionKeyFromquery: keyID”,也可以选择应用动态分区密钥按钮使用动态分区键/值对自动生成 S3 存储桶前缀。在使用内联解析或 Lambda AWS 对数据进行分区时,您还可以在您的 S3 存储桶前缀中使用以下表达式形式:! {namespace: value},其中命名空间可以是 Query partitionKeyFrom 或 Lambda。 partitionKeyFrom

    S3 存储桶和 S3 错误输出前缀时区

    Amazon S3 对象的自定义前缀中选择要用作日期和时间的时区。默认情况下,Firehose 会添加以 UTC 为单位的时间前缀。如果您想使用不同的时区,则可以更改 S3 前缀中使用的时区。

    缓冲提示

    Data Firehose 在将传入数据传输到指定的目的地之前会进行缓冲。目标位置的建议缓冲区大小因服务提供商而异。

    S3 压缩

    选择 GZIP、Snappy、Zip 或 Hadoop 兼容的 Snappy 数据压缩,或者不压缩数据。Snappy、Zip 和 Hadoop 兼容的 Snappy 压缩,不适用于以 Amazon Redshift 作为目的地的 Firehose 流。

    S3 文件扩展名格式(可选)

    为传输到 Amazon S3 目标存储桶的对象指定文件扩展名格式。如果启用此功能,则指定的文件扩展名将覆盖数据格式转换或 S3 压缩功能(例如 .parquet 或 .gz)附加的默认文件扩展名。在将此功能与数据格式转换或 S3 压缩配合使用时,请确保您配置了正确的文件扩展名。文件扩展名必须以句点(.)开头,并且可以包含允许的字符:0-9a-z!-_.*‘()。文件扩展名不能超过 128 个字符。

    S3 加密

    Firehose 支持使用 AWS Key Management Service (SSE-KMS) 的 Amazon S3 服务器端加密,用于加密亚马逊 S3 中交付的数据。您可以选择使用目标 S3 存储桶中指定的默认加密类型,也可以选择使用您拥有的 AWS KMS 密钥列表中的密钥进行加密。如果您使用密钥加密数据,则可以使用默认 AWS 托管 AWS KMS 密钥 (aws/s3) 或客户托管密钥。有关更多信息,请参阅使用 AWS KMS 托管密钥的服务器端加密 (SSE-KMS) 保护数据

配置 Apache Iceberg 表的目的地设置

AWS 区域中国地区和亚太地区(马来西亚)外,Firehose 在所有地区都支持 Apache Iceberg Tables 作为目的地。 AWS GovCloud (US) Regions

有关将 Apache Iceberg 表作为目的地的更多信息,请参阅使用 Amazon Data Firehose 将数据传输到 Apache Iceberg 表

为 Amazon Redshift 配置目的地设置

本节介绍使用 Amazon Redshift 作为 Firehose 流目的地的设置。

根据您是否拥有 Amazon Redshift 预置集群或 Amazon Redshift Serverless 工作组,选择以下任一过程。

Amazon Redshift 预置集群

本节介绍使用 Amazon Redshift 预置集群作为 Firehose 流目的地的设置。

  • 输入以下字段的值:

    集群

    Amazon Redshift 集群,S3 存储桶数据将复制到该集群。将 Amazon Redshift 集群配置为可公开访问,并取消阻止 Amazon Data Firehose IP 地址。有关更多信息,请参阅 授予 Firehose 对 Amazon Redshift 目的地的访问权限

    身份验证

    您可以选择直接输入用户名/密码,也可以从中检索密钥 AWS Secrets Manager 以访问 Amazon Redshift 集群。

    • 用户名

      指定有权访问 Amazon Redshift 集群的 Amazon Redshift 用户。该用户必须具有 Amazon Redshift INSERT 权限才能将数据从 S3 存储桶复制到 Amazon Redshift 集群。

    • 密码

      指定有权访问集群的用户的密码。

    • 密钥

      从中 AWS Secrets Manager 选择一个包含 Amazon Redshift 集群凭证的密钥。如果在下拉列表中未看到您的密钥,则请在 AWS Secrets Manager 中为您的 Amazon Redshift 凭证创建一个。有关更多信息,请参阅 AWS Secrets Manager 在 Amazon Data Firehose 中进行身份验证

    数据库

    Amazon Redshift 数据库,数据将复制到该数据库。

    Amazon Redshift 表,数据将复制到该表。

    (可选)表的特定列,数据将复制到该特定列。如果 Amazon S3 对象中定义的列数少于 Amazon Redshift 表中的列数,请使用此选项。

    中间 S3 目标

    Firehose 会先将数据传输到 S3 存储桶,然后发出 Amazon Redshift COPY 命令将数据加载到 Amazon Redshift 集群。请指定一个您拥有的用于接收流数据的 S3 存储桶。创建新的 S3 存储桶或选择您当前拥有的存储桶。

    将数据加载到 Amazon Redshift 集群后,Firehose 不会将数据从 S3 存储桶中删除。您可以使用生命周期配置管理 S3 存储桶中的数据。有关更多信息,请参阅《Amazon Simple Storage Service 用户指南》中的对象生命周期管理

    中间 S3 存储桶前缀

    (可选)要对 Amazon S3 对象使用默认前缀,请将此选项留空。Firehose 会自动对传输的 Amazon S3 对象使用“YYYY/MM/dd/HH”UTC 时间格式的前缀。您可以将此前缀添加到开头。有关更多信息,请参阅 配置 Amazon S3 对象名称格式

    COPY options

    您可以在 Amazon Redshift COPY 命令中指定的参数。您可以根据自己的配置情况酌情使用这些参数。例如,如果启用了 Amazon S3 数据压缩,则必须使用 GZIP “”。 如果您的 S3 存储桶与您的 Amazon Redshift 集群不在同一个 AWS 区域,则必须填写 “REGION”。有关更多信息,请参阅《Amazon Redshift 数据库开发人员指南》中的 COPY

    COPY command

    Amazon Redshift COPY 命令。有关更多信息,请参阅《Amazon Redshift 数据库开发人员指南》中的 COPY

    Retry duration

    如果将数据 COPY 到 Amazon Redshift 集群失败,Firehose 重试的持续时间(0-7200 秒)。Firehose 每 5 分钟重试一次,直到重试持续时间结束。如果将重试持续时间设置为 0(零)秒,Firehose 在 COPY 命令失败时不会重试。

    缓冲提示

    Data Firehose 在将传入数据传输到指定的目的地之前会进行缓冲。目标位置的建议缓冲区大小因服务提供商而异。

    S3 压缩

    选择 GZIP、Snappy、Zip 或 Hadoop 兼容的 Snappy 数据压缩,或者不压缩数据。Snappy、Zip 和 Hadoop 兼容的 Snappy 压缩,不适用于以 Amazon Redshift 作为目的地的 Firehose 流。

    S3 文件扩展名格式(可选)

    S3 文件扩展名格式(可选):为传输到 Amazon S3 目标存储桶的对象指定文件扩展名格式。如果启用此功能,则指定的文件扩展名将覆盖数据格式转换或 S3 压缩功能(例如 .parquet 或 .gz)附加的默认文件扩展名。在将此功能与数据格式转换或 S3 压缩配合使用时,请确保您配置了正确的文件扩展名。文件扩展名必须以句点(.)开头,并且可以包含允许的字符:0-9a-z!-_.*‘()。文件扩展名不能超过 128 个字符。

    S3 加密

    Firehose 支持使用 AWS Key Management Service (SSE-KMS) 的 Amazon S3 服务器端加密,用于加密亚马逊 S3 中交付的数据。您可以选择使用目标 S3 存储桶中指定的默认加密类型,也可以选择使用您拥有的 AWS KMS 密钥列表中的密钥进行加密。如果您使用密钥加密数据,则可以使用默认 AWS 托管 AWS KMS 密钥 (aws/s3) 或客户托管密钥。有关更多信息,请参阅使用 AWS KMS 托管密钥的服务器端加密 (SSE-KMS) 保护数据

为 Amazon Redshift Serverless 工作组配置目的地设置

本节介绍使用 Amazon Redshift Serverless 工作组作为 Firehose 流目的地的设置。

  • 输入以下字段的值:

    Workgroup name (工作组名称)

    Amazon Redshift Serverless 工作组,S3 存储桶数据将复制到该工作组。将 Amazon Redshift Serverless 工作组配置为可公开访问,并取消阻止 Firehose IP 地址。有关更多信息,请参阅连接到 Amazon Redshift Serverless 中的“连接到可公开访问的 Amazon Redshift Serverless 实例”部分,以及“授予 Firehose 对 Amazon Redshift 目的地的访问权限 ”。

    身份验证

    您可以选择直接输入用户名/密码,也可以从中检索密钥以访问 Amazon Redshift Ser AWS Secrets Manager verless 工作组。

    • 用户名

      指定有权访问 Amazon Redshift Serverless 工作组的 Amazon Redshift 用户。该用户必须具有 Amazon Redshift INSERT 权限才能将数据从 S3 存储桶复制到 Amazon Redshift Serverless 工作组。

    • 密码

      指定有权访问 Amazon Redshift Serverless 工作组的用户的密码。

    • 密钥

      从中 AWS Secrets Manager 选择一个包含 Amazon Redshift 无服务器工作组凭证的密钥。如果在下拉列表中未看到您的密钥,则请在 AWS Secrets Manager 中为您的 Amazon Redshift 凭证创建一个。有关更多信息,请参阅 AWS Secrets Manager 在 Amazon Data Firehose 中进行身份验证

    数据库

    Amazon Redshift 数据库,数据将复制到该数据库。

    Amazon Redshift 表,数据将复制到该表。

    (可选)表的特定列,数据将复制到该特定列。如果 Amazon S3 对象中定义的列数少于 Amazon Redshift 表中的列数,请使用此选项。

    中间 S3 目标

    Amazon Data Firehose 会先将数据传输到 S3 存储桶,然后发出 Amazon Redshift COPY 命令,将数据加载到 Amazon Redshift Serverless 工作组。请指定一个您拥有的用于接收流数据的 S3 存储桶。创建新的 S3 存储桶或选择您当前拥有的存储桶。

    将数据加载到 Amazon Redshift Serverless 工作组后,Firehose 不会从 S3 存储桶中删除数据。您可以使用生命周期配置管理 S3 存储桶中的数据。有关更多信息,请参阅《Amazon Simple Storage Service 用户指南》中的对象生命周期管理

    中间 S3 存储桶前缀

    (可选)要对 Amazon S3 对象使用默认前缀,请将此选项留空。Firehose 会自动对传输的 Amazon S3 对象使用“YYYY/MM/dd/HH”UTC 时间格式的前缀。您可以将此前缀添加到开头。有关更多信息,请参阅 配置 Amazon S3 对象名称格式

    COPY options

    您可以在 Amazon Redshift COPY 命令中指定的参数。您可以根据自己的配置情况酌情使用这些参数。例如,如果启用了 Amazon S3 数据压缩,则必须使用 GZIP “”。 如果您的 S3 存储桶与您的 Amazon Redshift Serverless 工作组不在同一个 AWS 区域,则必须填写 “REGION”。有关更多信息,请参阅《Amazon Redshift 数据库开发人员指南》中的 COPY

    COPY command

    Amazon Redshift COPY 命令。有关更多信息,请参阅《Amazon Redshift 数据库开发人员指南》中的 COPY

    Retry duration

    如果将数据 COPY 到 Amazon Redshift Serverless 工作组失败,Firehose 重试的持续时间(0-7200 秒)。Firehose 每 5 分钟重试一次,直到重试持续时间结束。如果将重试持续时间设置为 0(零)秒,Firehose 在 COPY 命令失败时不会重试。

    缓冲提示

    Data Firehose 在将传入数据传输到指定的目的地之前会进行缓冲。目标位置的建议缓冲区大小因服务提供商而异。

    S3 压缩

    选择 GZIP、Snappy、Zip 或 Hadoop 兼容的 Snappy 数据压缩,或者不压缩数据。Snappy、Zip 和 Hadoop 兼容的 Snappy 压缩,不适用于以 Amazon Redshift 作为目的地的 Firehose 流。

    S3 文件扩展名格式(可选)

    S3 文件扩展名格式(可选):为传输到 Amazon S3 目标存储桶的对象指定文件扩展名格式。如果启用此功能,则指定的文件扩展名将覆盖数据格式转换或 S3 压缩功能(例如 .parquet 或 .gz)附加的默认文件扩展名。在将此功能与数据格式转换或 S3 压缩配合使用时,请确保您配置了正确的文件扩展名。文件扩展名必须以句点(.)开头,并且可以包含允许的字符:0-9a-z!-_.*‘()。文件扩展名不能超过 128 个字符。

    S3 加密

    Firehose 支持使用 AWS Key Management Service (SSE-KMS) 的 Amazon S3 服务器端加密,用于加密亚马逊 S3 中交付的数据。您可以选择使用目标 S3 存储桶中指定的默认加密类型,也可以选择使用您拥有的 AWS KMS 密钥列表中的密钥进行加密。如果您使用密钥加密数据,则可以使用默认 AWS 托管 AWS KMS 密钥 (aws/s3) 或客户托管密钥。有关更多信息,请参阅使用 AWS KMS 托管密钥的服务器端加密 (SSE-KMS) 保护数据

配置 OpenSearch 服务的目标设置

本节介绍在目的地使用 OpenSearch 服务的选项。

  • 输入以下字段的值:

    OpenSearch 服务域

    您的数据传输到的 OpenSearch 服务域。

    索引

    将数据索引到 OpenSearch 服务集群时使用的 OpenSearch 服务索引名称。

    Index rotation

    选择是否轮换 OpenSearch 服务索引以及轮换频率。如果启用了索引轮换,Amazon Data Firehose 会将相应的时间戳附加到指定的索引名称,并进行轮换。有关更多信息,请参阅 为 OpenSearch 服务配置索引轮换

    类型

    将数据索引到 OpenSearch 服务集群时使用的 OpenSearch 服务类型名称。对于 Elasticsearch 7. OpenSearch x 和 1.x,每个索引只能有一个类型。如果您尝试为已具有其他类型的现有索引指定新类型,Firehose 会在运行时返回错误。

    对于 Elasticsearch 7.x,请将此字段留空。

    Retry duration

    Firehose 在索引请求失败时重试的持续时间。 OpenSearch 对于重试持续时间,您可以设置介于 0-7200 秒之间的任何值。默认重试持续时间为 300 秒。在重试持续时间到期之前,Firehose 将多次重试,并关闭指数级退缩。

    重试持续时间到期后,Firehose 会将数据传输到死信队列(DLQ),这是配置的 S3 错误存储桶。对于传送到 DLQ 的数据,您必须将数据从配置的 S3 错误存储桶重新传回目的地。 OpenSearch

    如果您想因 OpenSearch 集群停机或维护而阻止 Firehose stream 向 DLQ 传输数据,则可以将重试持续时间配置为更高的值(以秒为单位)。您可以联系 AWS 支持人员,将上述重试持续时间值增加到 7200 秒。

    DocumentID 类型

    指示设置文档 ID 的方法。支持的方法有 Firehose 生成的文档 ID 和 OpenSearch 服务生成的文档 ID。未设置文档 ID 值时,Firehose 生成的文档 ID 是默认选项。 OpenSearch 推荐使用服务生成的文档 ID,因为它支持写入密集型操作,包括日志分析和可观察性,在 OpenSearch 服务域中消耗更少的 CPU 资源,从而提高性能。

    目标 VPC 连接

    如果您的 OpenSearch 服务域位于私有 VPC 中,请使用此部分指定该 VPC。还要指定您希望 Amazon Data Firehose 在向您的服务域发送数据时使用的子网和子组。 OpenSearch 您可以使用与 OpenSearch 服务域相同的安全组。如果您指定不同的安全组,请确保它们允许 OpenSearch 服务域安全组的出站 HTTPS 流量。此外,请确保 OpenSearch 服务域的安全组允许来自您在配置 Firehose 直播时指定的安全组的 HTTPS 流量。如果您对 Firehose 直播和 OpenSearch 服务域使用相同的安全组,请确保安全组的入站规则允许 HTTPS 流量。有关安全组规则的更多信息,请参阅 Amazon VPC 文档中的安全组规则

    重要

    在私有 VPC 中指定将数据传输到目的地的子网时,请确保所选子网中有足够数量的免费 IP 地址。如果指定子网中没有可用的免费 IP 地址,Firehose 将无法在私有 VPC 中创建或添加 ENIs 数据传输,并且传输将降级或失败。

    缓冲区提示

    Amazon Data Firehose 在将传入数据传输到指定的目的地之前会进行缓冲。目标位置的建议缓冲区大小因服务提供商而异。

为 OpenSearch 无服务器配置目标设置

本节介绍在目的地使用 OpenSearch 无服务器的选项。

  • 输入以下字段的值:

    OpenSearch 无服务器集合

    数据传输到的一组 OpenSearch 无服务器索引的终端节点。

    索引

    将数据索引到 OpenSearch 无服务器集合时使用的 OpenSearch 无服务器索引名称。

    目标 VPC 连接

    如果您的 OpenSearch 无服务器集合位于私有 VPC 中,请使用此部分指定该 VPC。还要指定您希望 Amazon Data Firehose 在向您的无服务器集合发送数据时使用的子网和子组。 OpenSearch

    重要

    在私有 VPC 中指定将数据传输到目的地的子网时,请确保所选子网中有足够数量的免费 IP 地址。如果指定子网中没有可用的免费 IP 地址,Firehose 将无法在私有 VPC 中创建或添加 ENIs 数据传输,并且传输将降级或失败。

    Retry duration

    如果向 Serverless 发出的索引请求失败,Firehose 重试的持续时间。 OpenSearch 对于重试持续时间,您可以设置介于 0-7200 秒之间的任何值。默认重试持续时间为 300 秒。在重试持续时间到期之前,Firehose 将多次重试,并关闭指数级退缩。

    重试持续时间到期后,Firehose 会将数据传输到死信队列(DLQ),这是配置的 S3 错误存储桶。对于传输到 DLQ 的数据,您必须将数据从配置的 S3 错误存储桶重新驱动回 OpenSearch 无服务器目标。

    如果由于 OpenSearch 无服务器集群的停机或维护而想要阻止 Firehose stream 向 DLQ 传输数据,则可以将重试持续时间配置为更高的值(以秒为单位)。您可以联系 AWS 支持人员,将上述重试持续时间值增加到 7200 秒。

    缓冲区提示

    Amazon Data Firehose 在将传入数据传输到指定的目的地之前会进行缓冲。目标位置的建议缓冲区大小因服务提供商而异。

配置 HTTP 端点的目的地设置

本节介绍了使用 HTTP 端点作为目标的选项。

重要

如果您选择 HTTP 端点作为目标,请查看并按照 了解 HTTP 端点传输请求和响应规范 中的说明进行操作。

  • 提供下列字段的值:

    HTTP 端点名称(可选)

    为 HTTP 端点指定一个用户友好的名称。例如,My HTTP Endpoint Destination

    HTTP 端点 URL

    按以下格式指定 HTTP 端点的 URL:https://xyz.httpendpoint.com。URL 必须是 HTTPS URL。

    身份验证

    您可以选择直接输入访问密钥,也可以从中检索密钥 AWS Secrets Manager 以访问 HTTP 端点。

    • (可选)访问密钥

      如果您需要获取访问密钥,以便从 Firehose 向其端点传输数据,请联系端点所有者。

    • 密钥

      从中选择一个包 AWS Secrets Manager 含 HTTP 端点访问密钥的密钥。如果您在下拉列表中看不到您的密钥,请在中 AWS Secrets Manager 为访问密钥创建一个密钥。有关更多信息,请参阅 AWS Secrets Manager 在 Amazon Data Firehose 中进行身份验证

    内容编码

    Amazon Data Firehose 使用内容编码来压缩请求的正文,然后再将请求发送到目的地。选择 GZIP禁用,以启用/禁用请求的内容编码。

    Retry duration

    指定 Amazon Data Firehose 重试将数据发送到所选 HTTP 端点的时长。

    发送数据后,Amazon Data Firehose 先等待 HTTP 端点的确认。如果出现错误或未在确认超时期限内收到确认,Amazon Data Firehose 将启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。重试持续时间到期后,Amazon Data Firehose 将这种情况视为数据传输失败,并将数据备份到 Amazon S3 存储桶。

    每次 Amazon Data Firehose 向 HTTP 端点发送数据(初始尝试或重试)时,都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试持续时间已过,Amazon Data Firehose 仍会等待确认,直到收到确认或达到确认超时期限。如果确认超时,Amazon Data Firehose 会确定重试计数器是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果不希望 Amazon Data Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Amazon Data Firehose 在每次 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    缓冲提示

    Amazon Data Firehose 在将传入数据传输到指定的目的地之前会进行缓冲。目标位置的建议缓冲区大小因服务提供商而异。

    重要

    对于 HTTP 终端节点目标,如果您在 “ CloudWatch 日志” 中看到来自目标端点的 413 个响应代码,请降低 Firehose 流上的缓冲提示大小,然后重试。

为 Datadog 配置目的地设置

本节介绍了使用 Datadog 作为目标的选项。有关 Datadog 的更多信息,请参阅 https://docs.datadoghq.com/integrations/ amazon_web_services/。

  • 提供下列字段的值。

    HTTP 端点 URL

    从下拉菜单中的以下选项之一选择要从中发送数据的位置。

    • Datadog 日志- US1

    • Datadog 日志- US3

    • Datadog 日志- US5

    • Datadog 日志- AP1

    • Datadog 日志 - EU

    • Datadog 日志 - GOV

    • Datadog 指标 - US

    • Datadog 指标- US5

    • Datadog 指标- AP1

    • Datadog 指标 - EU

    • Datadog 配置- US1

    • Datadog 配置- US3

    • Datadog 配置- US5

    • Datadog 配置- AP1

    • Datadog 配置 - EU

    • Datadog 配置 - US GOV

    身份验证

    你可以选择直接输入 API 密钥,也可以从中检索密钥 AWS Secrets Manager 来访问 Datadog。

    • API 密钥

      联系 Datadog 以获取您从 Firehose 向此端点传输数据所需的 API 密钥。

    • 密钥

      从中选择一个包 AWS Secrets Manager 含 Datadog API 密钥的密钥。如果在下拉列表中未看到您的密钥,则请在 AWS Secrets Manager中创建一个。有关更多信息,请参阅 AWS Secrets Manager 在 Amazon Data Firehose 中进行身份验证

    内容编码

    Amazon Data Firehose 使用内容编码来压缩请求的正文,然后再将请求发送到目的地。选择 GZIP禁用,以启用/禁用请求的内容编码。

    Retry duration

    指定 Amazon Data Firehose 重试将数据发送到所选 HTTP 端点的时长。

    发送数据后,Amazon Data Firehose 先等待 HTTP 端点的确认。如果出现错误或未在确认超时期限内收到确认,Amazon Data Firehose 将启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。重试持续时间到期后,Amazon Data Firehose 将这种情况视为数据传输失败,并将数据备份到 Amazon S3 存储桶。

    每次 Amazon Data Firehose 向 HTTP 端点发送数据(初始尝试或重试)时,都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试持续时间已过,Amazon Data Firehose 仍会等待确认,直到收到确认或达到确认超时期限。如果确认超时,Amazon Data Firehose 会确定重试计数器是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果不希望 Amazon Data Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Amazon Data Firehose 在每次 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    缓冲提示

    Amazon Data Firehose 在将传入数据传输到指定的目的地之前会进行缓冲。目标位置的建议缓冲区大小因服务提供商而异。

为 Honeycomb 配置目的地设置

本节介绍了使用 Honeycomb 作为目标的选项。有关 Honeycomb 的更多信息,请参阅 https://docs.honeycomb. io/getting-data-in/metrics/aws-cloudwatch-metrics/。

  • 提供下列字段的值:

    Honeycomb Kinesis 端点

    使用以下格式指定 HTTP 终端节点的网址: https://api.honeycomb.io/1/kinesis_events/ {{dataset}}

    身份验证

    您可以选择直接输入 API 密钥,也可以从中检索密钥 AWS Secrets Manager 以访问 Honeycomb。

    • API 密钥

      联系 Honeycomb 以获取您从 Firehose 向此端点传输数据所需的 API 密钥。

    • 密钥

      从中选择一个包含 Hon AWS Secrets Manager eycomb API 密钥的密钥。如果在下拉列表中未看到您的密钥,则请在 AWS Secrets Manager中创建一个。有关更多信息,请参阅 AWS Secrets Manager 在 Amazon Data Firehose 中进行身份验证

    内容编码

    Amazon Data Firehose 使用内容编码来压缩请求的正文,然后再将请求发送到目的地。选择 GZIP 以启用请求的内容编码。这是 Honeycomb 目标的推荐选项。

    Retry duration

    指定 Amazon Data Firehose 重试将数据发送到所选 HTTP 端点的时长。

    发送数据后,Amazon Data Firehose 先等待 HTTP 端点的确认。如果出现错误或未在确认超时期限内收到确认,Amazon Data Firehose 将启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。重试持续时间到期后,Amazon Data Firehose 将这种情况视为数据传输失败,并将数据备份到 Amazon S3 存储桶。

    每次 Amazon Data Firehose 向 HTTP 端点发送数据(初始尝试或重试)时,都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试持续时间已过,Amazon Data Firehose 仍会等待确认,直到收到确认或达到确认超时期限。如果确认超时,Amazon Data Firehose 会确定重试计数器是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果不希望 Amazon Data Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Amazon Data Firehose 在每次 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    缓冲提示

    Amazon Data Firehose 在将传入数据传输到指定的目的地之前会进行缓冲。目标位置的建议缓冲区大小因服务提供商而异。

为 Coralogix 配置目的地设置

本节介绍了使用 Coralogix 作为目标的选项。有关 Coralogix 的更多信息,请参阅 Get Started with Coralogix

  • 提供下列字段的值:

    HTTP 端点 URL

    从下拉菜单的以下选项中选择 HTTP 端点 URL:

    • Coralogix - US

    • Coralogix - SINGAPORE

    • Coralogix - IRELAND

    • Coralogix - INDIA

    • Coralogix - STOCKHOLM

    身份验证

    您可以选择直接输入私钥,也可以从中检索密钥 AWS Secrets Manager 以访问 Coralogix。

    • 私有密钥

      联系 Coralogix 以获取您从 Firehose 向此端点传输数据所需的私有密钥。

    • 密钥

      从中选择一个包 AWS Secrets Manager 含 Coralogix 私钥的密钥。如果在下拉列表中未看到您的密钥,则请在 AWS Secrets Manager中创建一个。有关更多信息,请参阅 AWS Secrets Manager 在 Amazon Data Firehose 中进行身份验证

    内容编码

    Amazon Data Firehose 使用内容编码来压缩请求的正文,然后再将请求发送到目的地。选择 GZIP 以启用请求的内容编码。这是 Coralogix 目标的推荐选项。

    Retry duration

    指定 Amazon Data Firehose 重试将数据发送到所选 HTTP 端点的时长。

    发送数据后,Amazon Data Firehose 先等待 HTTP 端点的确认。如果出现错误或未在确认超时期限内收到确认,Amazon Data Firehose 将启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。重试持续时间到期后,Amazon Data Firehose 将这种情况视为数据传输失败,并将数据备份到 Amazon S3 存储桶。

    每次 Amazon Data Firehose 向 HTTP 端点发送数据(初始尝试或重试)时,都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试持续时间已过,Amazon Data Firehose 仍会等待确认,直到收到确认或达到确认超时期限。如果确认超时,Amazon Data Firehose 会确定重试计数器是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果不希望 Amazon Data Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Amazon Data Firehose 在每次 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    • applicationName:运行 Data Firehose 的环境

    • subsystemName:Data Firehose 集成的名称

    • computerName:正在使用的 Firehose 流的名称

    缓冲提示

    Amazon Data Firehose 在将传入数据传输到指定的目的地之前会进行缓冲。目的地的建议缓冲区大小因服务提供商而异。

为 Dynatrace 配置目的地设置

本节介绍了使用 Dynatrace 作为目标的选项。有关更多信息,请参阅 https://www.dynatrace.com/support/help/technology-support/cloud-platforms/amazon-web-services/integrations/cloudwatch-metric-streams/

  • 选择选项,以将 Dynatrace 作为 Firehose 流的目的地。

    摄取类型

    选择您要在 Dynatrace 中提供指标还是日志(默认),以供进一步分析和处理。

    HTTP 端点 URL

    从下拉菜单中选择 HTTP 端点 URL(Dynatrace USDynatrace EUDynatrace Global)。

    身份验证

    您可以选择直接输入 API 令牌,也可以从中检索密钥 AWS Secrets Manager 以访问 Dynatrace。

    API URL

    提供 Dynatrace 环境的 API URL。

    内容编码

    选择是否要启用内容编码来压缩请求的正文。Amazon Data Firehose 使用内容编码来压缩请求的正文,然后再将请求发送到目的地。启用后,以 GZIP 格式压缩内容。

    Retry duration

    指定 Firehose 重试将数据发送到所选 HTTP 端点的时长。

    发送数据后,Firehose 先等待 HTTP 端点的确认。如果出现错误或在确认超时期限内没有收到确认,Firehose 将启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。重试持续时间到期后,Firehose 将这种情况视为数据传输失败,并将数据备份到 Amazon S3 存储桶。

    每次 Firehose 向 HTTP 端点发送数据(初始尝试期间或重试后)时,都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试持续时间到期,Firehose 仍会等待确认,直到它收到确认或到达确认超时期限。如果确认超时,Firehose 会确定重试计数器中是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果不希望 Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Amazon Data Firehose 在每次 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    缓冲提示

    Amazon Data Firehose 在将传入数据传输到指定的目的地之前会进行缓冲。缓冲区提示包括流的缓冲区大小和时间间隔。目的地的建议缓冲区大小因服务提供商而异。

配置目标设置 LogicMonitor

本部分介绍将 LogicMonitor 用于您的目标的选项。有关更多信息,请参阅 https://www.logicmonitor.com

  • 提供下列字段的值:

    HTTP 端点 URL

    按以下格式指定 HTTP 端点的 URL。

    https://ACCOUNT.logicmonitor.com
    身份验证

    您可以选择直接输入 API 密钥,也可以从中检索密钥 AWS Secrets Manager 进行访问 LogicMonitor。

    • API 密钥

      请联系 LogicMonitor 以获取允许从 Firehose 向该端点传输数据所需的 API 密钥。

    • 密钥

      从中选择一个包 AWS Secrets Manager 含 API 密钥的密钥 LogicMonitor。如果在下拉列表中未看到您的密钥,则请在 AWS Secrets Manager中创建一个。有关更多信息,请参阅 AWS Secrets Manager 在 Amazon Data Firehose 中进行身份验证

    内容编码

    Amazon Data Firehose 使用内容编码来压缩请求的正文,然后再将请求发送到目的地。选择 GZIP禁用,以启用/禁用请求的内容编码。

    Retry duration

    指定 Amazon Data Firehose 重试将数据发送到所选 HTTP 端点的时长。

    发送数据后,Amazon Data Firehose 先等待 HTTP 端点的确认。如果出现错误或未在确认超时期限内收到确认,Amazon Data Firehose 将启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。重试持续时间到期后,Amazon Data Firehose 将这种情况视为数据传输失败,并将数据备份到 Amazon S3 存储桶。

    每次 Amazon Data Firehose 向 HTTP 端点发送数据(初始尝试或重试)时,都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试持续时间已过,Amazon Data Firehose 仍会等待确认,直到收到确认或达到确认超时期限。如果确认超时,Amazon Data Firehose 会确定重试计数器是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果不希望 Amazon Data Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Amazon Data Firehose 在每次 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    缓冲提示

    Amazon Data Firehose 在将传入数据传输到指定的目的地之前会进行缓冲。目标位置的建议缓冲区大小因服务提供商而异。

为 Logz.io 配置目的地设置

本节介绍了使用 Logz.io 作为目标的选项。欲了解更多信息,请参阅 https://logz.io/

注意

在欧洲地区(米兰)区域,不支持将 Logz.io 作为 Amazon Data Firehose 目的地。

  • 提供下列字段的值:

    HTTP 端点 URL

    按以下格式指定 HTTP 端点的 URL。URL 必须是 HTTPS URL。

    https://listener-aws-metrics-stream-<region>.logz.io/

    例如

    https://listener-aws-metrics-stream-us.logz.io/
    身份验证

    您可以选择直接输入发货令牌,也可以从中检索密钥 AWS Secrets Manager 以访问 Logz.io。

    • 送达令牌

      联系 Logz.io 以获取您从 Firehose 向此端点传输数据所需的送达令牌。

    • 密钥

      从中 AWS Secrets Manager 选择一个包含 Logz.io 发货令牌的密钥。如果在下拉列表中未看到您的密钥,则请在 AWS Secrets Manager中创建一个。有关更多信息,请参阅 AWS Secrets Manager 在 Amazon Data Firehose 中进行身份验证

    Retry duration

    指定 Amazon Data Firehose 重试向 Logz.io 发送数据的时长。

    发送数据后,Amazon Data Firehose 先等待 HTTP 端点的确认。如果出现错误或未在确认超时期限内收到确认,Amazon Data Firehose 将启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。重试持续时间到期后,Amazon Data Firehose 将这种情况视为数据传输失败,并将数据备份到 Amazon S3 存储桶。

    每次 Amazon Data Firehose 向 HTTP 端点发送数据(初始尝试或重试)时,都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试持续时间已过,Amazon Data Firehose 仍会等待确认,直到收到确认或达到确认超时期限。如果确认超时,Amazon Data Firehose 会确定重试计数器是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果不希望 Amazon Data Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Amazon Data Firehose 在每次 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    缓冲提示

    Amazon Data Firehose 在将传入数据传输到指定的目的地之前会进行缓冲。目标位置的建议缓冲区大小因服务提供商而异。

为 MongoDB Cloud 配置目的地设置

本节介绍了使用 MongoDB Cloud 作为目标的选项。有关更多信息,请参阅 https://www.mongodb.com

  • 提供下列字段的值:

    MongoDB Realm webhook URL

    按以下格式指定 HTTP 端点的 URL。

    https://webhooks.mongodb-realm.com

    URL 必须是 HTTPS URL。

    身份验证

    您可以选择直接输入 API 密钥,也可以从中检索密钥 AWS Secrets Manager 以访问 MongoDB Cloud。

    • API 密钥

      联系 MongoDB Cloud 以获取您从 Firehose 向此端点传输数据所需的 API 密钥。

    • 密钥

      从中 AWS Secrets Manager 选择一个包含 MongoDB 云端 API 密钥的密钥。如果在下拉列表中未看到您的密钥,则请在 AWS Secrets Manager中创建一个。有关更多信息,请参阅 AWS Secrets Manager 在 Amazon Data Firehose 中进行身份验证

    内容编码

    Amazon Data Firehose 使用内容编码来压缩请求的正文,然后再将请求发送到目的地。选择 GZIP禁用,以启用/禁用请求的内容编码。

    Retry duration

    指定 Amazon Data Firehose 重试将数据发送到所选第三方提供商的时长。

    发送数据后,Amazon Data Firehose 先等待 HTTP 端点的确认。如果出现错误或未在确认超时期限内收到确认,Amazon Data Firehose 将启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。重试持续时间到期后,Amazon Data Firehose 将这种情况视为数据传输失败,并将数据备份到 Amazon S3 存储桶。

    每次 Amazon Data Firehose 向 HTTP 端点发送数据(初始尝试或重试)时,都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试持续时间已过,Amazon Data Firehose 仍会等待确认,直到收到确认或达到确认超时期限。如果确认超时,Amazon Data Firehose 会确定重试计数器是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果不希望 Amazon Data Firehose 重试发送数据,请将此值设置为 0。

    缓冲提示

    Amazon Data Firehose 在将传入数据传输到指定的目的地之前会进行缓冲。目标位置的建议缓冲区大小因服务提供商而异。

    参数(可选)

    Amazon Data Firehose 在每次 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

为 New Relic 配置目的地设置

本节介绍了使用 New Relic 作为目标的选项。有关更多信息,请参阅 https://newrelic.com

  • 提供下列字段的值:

    HTTP 端点 URL

    从下拉列表的以下选项中选择 HTTP 端点 URL。

    • New Relic 日志 - US

    • New Relic 指标 - US

    • New Relic 指标 - EU

    身份验证

    你可以选择直接输入 API 密钥,也可以从中检索密钥 AWS Secrets Manager 来访问 New Relic。

    • API 密钥

      在 New Relic One 账户设置中输入许可证密钥(40 个字符的十六进制字符串)。您需要此 API 密钥从 Firehose 向此端点传输数据。

    • 密钥

      从中选择一个包含 N AWS Secrets Manager ew Relic 的 API 密钥的密钥。如果在下拉列表中未看到您的密钥,则请在 AWS Secrets Manager中创建一个。有关更多信息,请参阅 AWS Secrets Manager 在 Amazon Data Firehose 中进行身份验证

    内容编码

    Amazon Data Firehose 使用内容编码来压缩请求的正文,然后再将请求发送到目的地。选择 GZIP禁用,以启用/禁用请求的内容编码。

    Retry duration

    指定 Amazon Data Firehose 重试将数据发送到 New Relic HTTP 端点的时长。

    发送数据后,Amazon Data Firehose 先等待 HTTP 端点的确认。如果出现错误或未在确认超时期限内收到确认,Amazon Data Firehose 将启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。重试持续时间到期后,Amazon Data Firehose 将这种情况视为数据传输失败,并将数据备份到 Amazon S3 存储桶。

    每次 Amazon Data Firehose 向 HTTP 端点发送数据(初始尝试或重试)时,都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试持续时间已过,Amazon Data Firehose 仍会等待确认,直到收到确认或达到确认超时期限。如果确认超时,Amazon Data Firehose 会确定重试计数器是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果不希望 Amazon Data Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Amazon Data Firehose 在每次 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    缓冲提示

    Amazon Data Firehose 在将传入数据传输到指定的目的地之前会进行缓冲。目标位置的建议缓冲区大小因服务提供商而异。

为 Snowflake 配置目的地设置

本节介绍将 Snowflake 用于您的目的地的选项。

注意

Firehose 与 Snowflake 的集成已在美国东部(弗吉尼亚北部)、美国西部(俄勒冈)、欧洲(爱尔兰)、美国东部(俄亥俄州)、亚太地区(东京)、欧洲(法兰克福)、亚太地区(新加坡)、亚太地区(首尔)和亚太地区(悉尼)、亚太地区(孟买)、欧洲(伦敦)、南美洲(圣保罗)、加拿大(中部)、欧洲(中部)、欧洲(悉尼)、亚太地区(孟买)、欧洲(伦敦)、南美洲(圣保罗)、加拿大(中部)、欧洲(中部)、欧洲(中部)巴黎)、亚太地区(大阪)、欧洲(斯德哥尔摩)、亚太地区(雅加达)。 AWS 区域

连接设置
  • 提供下列字段的值:

    Snowflake 账户 URL

    指定 Snowflake 账户 URL。例如:xy12345.us-east-1.aws.snowflakecomputing.com。有关如何确定您的账户 URL 的信息,请参阅 Snowflake 文档。请注意,您不能指定端口号,而协议(https://)是可选的。

    身份验证

    您可以选择手动输入用户登录名、私钥和密码,也可以从 AWS Secrets Manager 中检索密钥以访问 Snowflake。

    • 用户登录

      指定要用于加载数据的 Snowflake 用户。请确保用户有权将数据插入到 Snowflake 表中。

    • 私有密钥

      指定私有密钥,以便使用 Snowflake 以 PKCS8 格式进行身份验证。此外,不要将 PEM 页眉和页脚作为私有密钥的一部分。如果密钥被分成多行,则请删除换行符。以下为私有密钥必须呈现的形式的示例。

      -----BEGIN PRIVATE KEY----- KEY_CONTENT -----END PRIVATE KEY-----

      移除 KEY_CONTENT 中的空格然后将其提供给 Firehose。无需页眉/页脚或换行符。

    • Passphrase (密码)

      指定密码来解密已加密的私有密钥。如果私有密钥未加密,则可以将此字段留空。有关信息,请参阅 Using Key Pair Authentication & Key Rotation

    • 密钥

      从中 AWS Secrets Manager 选择一个包含 Snowflake 凭据的密钥。如果在下拉列表中未看到您的密钥,则请在 AWS Secrets Manager中创建一个。有关更多信息,请参阅 AWS Secrets Manager 在 Amazon Data Firehose 中进行身份验证

    角色配置

    使用默认的 Snowflake 角色:如果选择此选项,则 Firehose 不会将任何角色传递给 Snowflake。假设默认角色用于加载数据。请确保默认角色具有将数据插入到 Snowflake 表中的权限。

    使用自定义 Snowflake 角色:输入将数据加载到 Snowflake 表时由 Firehose 担任的非默认 Snowflake 角色。

    Snowflake 连接

    选项为私有公有

    私有 VPCE ID(可选)

    Firehose 与 Snowflake 私有连接的 VPCE ID。身份证格式为 com.amazonaws.vpce。 [区域] .vpce-svc-。[id]有关更多信息,请参阅 AWS PrivateLink & Snowflake

    注意

    如果您的 Snowflake 集群已启用私有链接,则请使用基于 AwsVpceIds 的网络策略来允许 Amazon Data Firehose 数据。Firehose 不需要您在 Snowflake 账户中配置基于 IP 的网络策略。启用基于 IP 的网络策略可能会干扰 Firehose 连接。如果您遇到需要基于 IP 的策略的边缘案例,则请通过提交支持工单与 Firehose 团队联系。有关您可以使用的 VPCE IDs 列表,请参阅。访问 VPC 中的 Snowflake

数据库配置
  • 您必须指定以下设置,才能使用 Snowflake 作为 Firehose 流的目的地。

    • Snowflake 数据库:Snowflake 中的所有数据都保存在数据库中。

    • Snowflake 架构:每个数据库由一个或多个架构组成,这些架构是数据库对象(例如表和视图)的逻辑分组

    • Snowflake 表:Snowflake 中的所有数据都存储在数据库表中,逻辑结构为列和行的集合。

您 Snowflake 表的数据加载选项

  • 使用 JSON 键作为列名

  • 使用 VARIANT 列

    • 内容列名:在表中指定列名,其中必须加载原始数据。

    • 元数据列名(可选):在表中指定列名,其中必须加载元数据信息。启用此字段后,您将在基于源类型的 Snowflake 表中看到以下列。

      用于直接 PUT 作为来源

      { "firehoseDeliveryStreamName" : "streamname", "IngestionTime" : "timestamp" }

      对于 Kinesis 数据流作为源

      { "kinesisStreamName" : "streamname", "kinesisShardId" : "Id", "kinesisPartitionKey" : "key", "kinesisSequenceNumber" : "1234", "subsequenceNumber" : "2334", "IngestionTime" : "timestamp" }

Retry duration

Snowflake 服务问题导致打开通道或向 Snowflake 传输内容失败时,Firehose 重试的持续时间(0–7200 秒)。Firehose 以指数回退方式重试,直到重试持续时间结束。如果将重试持续时间设置为 0(零)秒,则 Firehose 在 Snowflake 失败时不会重试,而是将数据路由至 Amazon S3 错误存储桶。

缓冲区提示

Amazon Data Firehose 在将传入数据传输到指定的目的地之前会进行缓冲。目标位置的建议缓冲区大小因服务提供商而异。有关更多信息,请参阅 配置缓冲提示

为 Splunk 配置目的地设置

本节介绍使用将 Splunk 用于目的地的选项。

注意

Firehose 向配置了经典负载均衡器或应用程序负载均衡器的 Splunk 集群传输数据。

  • 提供下列字段的值:

    Splunk cluster endpoint

    要确定端点,请参阅 Splunk 文档中的配置 Amazon Data Firehose 以将数据发送到 Splunk 平台

    Splunk endpoint type

    在大多数情况下,请选择 Raw endpoint。选择Event endpoint是否使用按事件类型将数据发送 AWS Lambda 到不同的索引来预处理数据。有关要使用的端点的信息,请参阅 Splunk 文档中的配置 Amazon Data Firehose 以将数据发送到 Splunk 平台

    身份验证

    您可以选择直接输入身份验证令牌,也可以从中检索密钥 AWS Secrets Manager 以访问 Splunk。

    HEC acknowledgement timeout

    指定 Amazon Data Firehose 等待来自 Splunk 的索引确认的时长。如果 Splunk 在超时之前未发送确认,Amazon Data Firehose 会将这种情况视为数据传输失败。然后,Amazon Data Firehose 会重试或将数据备份到 Amazon S3 存储桶,具体取决于您设置的重试持续时间值。

    Retry duration

    指定 Amazon Data Firehose 重试向 Splunk 发送数据的时长。

    发送数据后,Amazon Data Firehose 先等待 Splunk 的确认。如果出现错误或未在确认超时期限内收到确认,Amazon Data Firehose 将启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。重试持续时间到期后,Amazon Data Firehose 将这种情况视为数据传输失败,并将数据备份到 Amazon S3 存储桶。

    每次 Amazon Data Firehose 向 Splunk 发送数据(无论是初次尝试还是重试)时,都会重新启动确认超时计数器,并等待 Splunk 的确认。

    即使重试持续时间已过,Amazon Data Firehose 仍会等待确认,直到收到确认或达到确认超时期限。如果确认超时,Amazon Data Firehose 会确定重试计数器是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果不希望 Amazon Data Firehose 重试发送数据,请将此值设置为 0。

    缓冲提示

    Amazon Data Firehose 在将传入数据传输到指定的目的地之前会进行缓冲。目的地的建议缓冲区大小因服务提供商而异。

为 Splunk Observability Cloud 配置目的地设置

本节介绍了使用 Splunk Observability Cloud 作为目标的选项。有关更多信息,请参阅 https://docs.splunk.com/observability/en/gdi/get-data-in/connect/aws/aws-apiconfig.html#--ap connect-to-aws-using i。the-splunk-observability-cloud

  • 提供下列字段的值:

    云摄取端点 URL

    您可以在 Splunk Observability 控制台的“配置文件”>“组织”>“实时数据摄取端点”中,找到 Splunk Observability Cloud 的实时数据摄取 URL。

    身份验证

    您可以选择直接输入访问令牌,也可以从中检索密钥 AWS Secrets Manager 以访问 Splunk Observability Cloud。

    • 访问令牌

      从 Splunk Observability 控制台的设置下的访问令牌中,复制具有 INGEST 授权范围的 Splunk Observability 访问令牌。

    • 密钥

      从中选择一个包 AWS Secrets Manager 含 Splunk 可观察性云访问令牌的密钥。如果在下拉列表中未看到您的密钥,则请在 AWS Secrets Manager中创建一个。有关更多信息,请参阅 AWS Secrets Manager 在 Amazon Data Firehose 中进行身份验证

    内容编码

    Amazon Data Firehose 使用内容编码来压缩请求的正文,然后再将请求发送到目的地。选择 GZIP禁用,以启用/禁用请求的内容编码。

    Retry duration

    指定 Amazon Data Firehose 重试将数据发送到所选 HTTP 端点的时长。

    发送数据后,Amazon Data Firehose 先等待 HTTP 端点的确认。如果出现错误或未在确认超时期限内收到确认,Amazon Data Firehose 将启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。重试持续时间到期后,Amazon Data Firehose 将这种情况视为数据传输失败,并将数据备份到 Amazon S3 存储桶。

    每次 Amazon Data Firehose 向 HTTP 端点发送数据(初始尝试或重试)时,都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试持续时间已过,Amazon Data Firehose 仍会等待确认,直到收到确认或达到确认超时期限。如果确认超时,Amazon Data Firehose 会确定重试计数器是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果不希望 Amazon Data Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Amazon Data Firehose 在每次 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    缓冲提示

    Amazon Data Firehose 在将传入数据传输到指定的目的地之前会进行缓冲。目标位置的建议缓冲区大小因服务提供商而异。

为 Sumo Logic 配置目的地设置

本节介绍了使用 Sumo Logic 作为目标的选项。有关更多信息,请参阅 https://www.sumologic.com

  • 提供下列字段的值:

    HTTP 端点 URL

    按以下格式指定 HTTP 端点的 URL:https://deployment name.sumologic.net/receiver/v1/kinesis/dataType/access token。URL 必须是 HTTPS URL。

    内容编码

    Amazon Data Firehose 使用内容编码来压缩请求的正文,然后再将请求发送到目的地。选择 GZIP禁用,以启用/禁用请求的内容编码。

    Retry duration

    指定 Amazon Data Firehose 重试向 Sumo Logic 发送数据的时长。

    发送数据后,Amazon Data Firehose 先等待 HTTP 端点的确认。如果出现错误或未在确认超时期限内收到确认,Amazon Data Firehose 将启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。重试持续时间到期后,Amazon Data Firehose 将这种情况视为数据传输失败,并将数据备份到 Amazon S3 存储桶。

    每次 Amazon Data Firehose 向 HTTP 端点发送数据(初始尝试或重试)时,都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试持续时间已过,Amazon Data Firehose 仍会等待确认,直到收到确认或达到确认超时期限。如果确认超时,Amazon Data Firehose 会确定重试计数器是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果不希望 Amazon Data Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Amazon Data Firehose 在每次 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    缓冲提示

    Amazon Data Firehose 在将传入数据传输到指定的目的地之前会进行缓冲。Elastic 目标的建议缓冲区大小因服务提供商而异。

为 Elastic 配置目的地设置

本节介绍了使用 Elastic 作为目标的选项。

  • 提供下列字段的值:

    Elastic 端点 URL

    按以下格式指定 HTTP 端点的 URL:https://<cluster-id>.es.<region>.aws.elastic-cloud.com。URL 必须是 HTTPS URL。

    身份验证

    您可以选择直接输入 API 密钥,也可以从中检索密钥 AWS Secrets Manager 以访问 Elastic。

    • API 密钥

      联系 Elastic 以获取从 Firehose 向其服务传输数据所需的 API 密钥。

    • 密钥

      从中 AWS Secrets Manager 选择一个包含 Elastic API 密钥的密钥。如果在下拉列表中未看到您的密钥,则请在 AWS Secrets Manager中创建一个。有关更多信息,请参阅 AWS Secrets Manager 在 Amazon Data Firehose 中进行身份验证

    内容编码

    Amazon Data Firehose 使用内容编码来压缩请求的正文,然后再将请求发送到目的地。选择 GZIP(默认选择)或禁用,以启用/禁用请求的内容编码。

    Retry duration

    指定 Amazon Data Firehose 重试向 Elastic 发送数据的时长。

    发送数据后,Amazon Data Firehose 先等待 HTTP 端点的确认。如果出现错误或未在确认超时期限内收到确认,Amazon Data Firehose 将启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。重试持续时间到期后,Amazon Data Firehose 将这种情况视为数据传输失败,并将数据备份到 Amazon S3 存储桶。

    每次 Amazon Data Firehose 向 HTTP 端点发送数据(初始尝试或重试)时,都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试持续时间已过,Amazon Data Firehose 仍会等待确认,直到收到确认或达到确认超时期限。如果确认超时,Amazon Data Firehose 会确定重试计数器是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果不希望 Amazon Data Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Amazon Data Firehose 在每次 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    缓冲提示

    Amazon Data Firehose 在将传入数据传输到指定的目的地之前会进行缓冲。Elastic 目标的建议缓冲区大小为 1MiB。