将流数据源添加到适用于 Apache Flink 的托管服务

PDF

聚焦模式

将流数据源添加到适用于 Apache Flink 的托管服务 - Managed Service for Apache Flink

使用 Kinesis 数据流使用亚马逊 MSK

Apache Flink 提供连接器以从文件、套接字、集合和自定义源中读取。在应用程序代码中，您可以使用 Apache Flink 源以从流中接收数据。本节介绍了可用于 Amazon 服务的源。

使用 Kinesis 数据流

将通过 Amazon Kinesis 数据流向您的应用程序KinesisStreamsSource提供流式传输数据。

创建 `KinesisStreamsSource`

以下代码示例说明了如何创建 KinesisStreamsSource：


// Configure the KinesisStreamsSource
Configuration sourceConfig = new Configuration();
sourceConfig.set(KinesisSourceConfigOptions.STREAM_INITIAL_POSITION, KinesisSourceConfigOptions.InitialPosition.TRIM_HORIZON); // This is optional, by default connector will read from LATEST

// Create a new KinesisStreamsSource to read from specified Kinesis Stream.
KinesisStreamsSource<String> kdsSource =
        KinesisStreamsSource.<String>builder()
                .setStreamArn("arn:aws:kinesis:us-east-1:123456789012:stream/test-stream")
                .setSourceConfig(sourceConfig)
                .setDeserializationSchema(new SimpleStringSchema())
                .setKinesisShardAssigner(ShardAssignerFactory.uniformShardAssigner()) // This is optional, by default uniformShardAssigner will be used.
                .build();

有关使用的更多信息KinesisStreamsSource，请参阅 Apache Flink 文档中的 Amazon Kinesis Data Stream s Connector 和我们在 Github 上的 KinesisConnectors 公开示例。

创建使用 `KinesisStreamsSource` EFO 消费端的

KinesisStreamsSource现在支持增强型扇出 (EF O)。

如果 Kinesis 使用者使用 EFO，则 Kinesis Data Streams 服务会为其提供自己的专用带宽，而不是让其与从流中读取数据的其他使用者共享流的固定带宽。

有关在 Kinesis 消费端上使用 EFO 的更多信息，请参阅 FLIP-128：Kinesis 消费者的增强型扇出 AWS。

您可以通过在 Kinesis 使用者上设置以下参数来启用 EFO 使用者：

READER_TYPE：将此参数设置为 EFO，让您的应用程序使用 EFO 使用者访问 Kinesis 数据流数据。
EFO_CONSUMER_NAME：将此参数设置为该流使用者中的唯一字符串值。在同一 Kinesis 数据流中重复使用使用者名称，会导致之前使用该名称的使用者被终止。

要将 a 配置KinesisStreamsSource为使用 EFO，请向消费端添加以下参数：


sourceConfig.set(KinesisSourceConfigOptions.READER_TYPE, KinesisSourceConfigOptions.ReaderType.EFO);
sourceConfig.set(KinesisSourceConfigOptions.EFO_CONSUMER_NAME, "my-flink-efo-consumer");

有关使用 EFO 使用者的适用于 Apache Flink 的托管服务应用程序的示例，请参阅我们在 Github 上公开的 Kinesis Connectors 示例。

使用亚马逊 MSK

KafkaSource源从 Amazon MSK 主题向您的应用程序提供流数据。

创建 `KafkaSource`

以下代码示例说明了如何创建 KafkaSource：


KafkaSource<String> source = KafkaSource.<String>builder()
    .setBootstrapServers(brokers)
    .setTopics("input-topic")
    .setGroupId("my-group")
    .setStartingOffsets(OffsetsInitializer.earliest())
    .setValueOnlyDeserializer(new SimpleStringSchema())
    .build();

env.fromSource(source, WatermarkStrategy.noWatermarks(), "Kafka Source");

有关使用 KafkaSource 的更多信息，请参阅MSK 复制。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

连接器

使用接收器写入数据

本页内容

选择您的 Cookie 首选项

自定义 Cookie 首选项

关键

性能

功能

广告

无法保存 Cookie 首选项

将流数据源添加到适用于 Apache Flink 的托管服务

使用 Kinesis 数据流

创建 `KinesisStreamsSource`

创建使用 `KinesisStreamsSource` EFO 消费端的

使用亚马逊 MSK

创建 `KafkaSource`

本页内容

此页内容对您是否有帮助？

下一主题：

上一主题：

需要帮助吗？

选择您的 Cookie 首选项

将流数据源添加到适用于 Apache Flink 的托管服务

使用 Kinesis 数据流

创建 KinesisStreamsSource

创建使用 KinesisStreamsSource EFO 消费端的

使用亚马逊 MSK

创建 KafkaSource

本页内容

此页内容对您是否有帮助？

下一主题：

上一主题：

需要帮助吗？

创建 `KinesisStreamsSource`

创建使用 `KinesisStreamsSource` EFO 消费端的

创建 `KafkaSource`