什麼是 Amazon 數據 Firehose? - Amazon Data Firehose

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

什麼是 Amazon 數據 Firehose?

Amazon 數據 Firehose 是一種全受管服務,用於將實時流數據交付到 Amazon Simple Storage OpenSearch Service (Amazon S3) Redshift,Amazon 服務,Amazon 無服務器,Splunk,Apache 冰山表以及受支持的第三方 OpenSearch 服務提供商擁有的任何自定義端點或端點,包括 Datadog,第三方服務提供商擁有的任何自定義HTTPHTTP端點或端點,包括數據多,第三方服務提供商,MongoDB,新遺物, LogicMonitorCoralogix 和彈性。使用 Amazon 資料 Firehose,您不需要撰寫應用程式或管理資源。您可以將資料生產者設定為將資料傳送到 Amazon Data Firehose,它會自動將資料傳送到您指定的目的地。您也可以將 Amazon 資料 Firehose 設定為在交付資料之前轉換資料。

如需有關 AWS 巨量資料解決方案的詳細資訊,請參閱上的大數據 AWS。如需 AWS 串流資料解決方案的詳細資訊,請參閱什麼是串流資料?

注意

請注意最新的 Amazon AWS 串流資料解決方案,MSK該解決方案提供 AWS CloudFormation 範本,讓資料流經生產者、串流儲存、消費者和目的地。

學習關鍵概念

當您開始使用 Amazon 資料 Firehose 時,您可以從瞭解下列概念中受益。

Firehose 溪

Amazon 數據 Firehose 件的基礎實體。您可以通過創建一個 Firehose 流,然後將數據發送到該流來使用 Amazon 數據防火軟管。如需詳細資訊,請參閱 教學課程:從主控台建立 Firehose 串流將資料傳送至 Firehose 串流

記錄

您的資料生產者會傳送至 Firehose 串流的感興趣資料。記錄最大可達 1,000 KB。

資料生產者

製作人將記錄發送到 Firehose 流。例如,將記錄資料傳送至 Firehose 串流的 Web 伺服器就是資料生產者。您也可以將 Firehose 串流設定為自動從現有 Kinesis 資料串流讀取資料,並將其載入目標。如需詳細資訊,請參閱將資料傳送至 Firehose 串流

緩衝區大小和緩衝區間隔

Amazon Data Firehose 會將傳入的串流資料緩衝為特定大小或一段時間,然後再將其傳送到目的地。 Buffer Size是在幾秒鐘內MBs並Buffer Interval且以秒為單位。

了解 Amazon 數據 Firehose 件中的數據流

以 Amazon S3 目的地而言,串流資料都交付至您的 S3 儲存貯體。如果已啟用資料轉換,您可以選擇性將原始資料備份到另一個 Amazon S3 儲存貯體。

顯示 Amazon Amazon S3 的亞馬遜數據 Firehose 數據流的圖表。

以 Amazon Redshift 目的地而言,串流資料會先交付至您的 S3 儲存貯體。然後,Amazon 數據 Firehose 發出 Amazon Redshift COPY 命令,將數據從 S3 存儲桶加載到 Amazon Redshift 集群。如果已啟用資料轉換,您可以選擇性將原始資料備份到另一個 Amazon S3 儲存貯體。

一個圖表顯示 Amazon 數據 Firehose 數據流 Amazon Redshift。

對於 OpenSearch 服務目的地,串流資料會傳遞到您的 OpenSearch服務叢集,並且可以選擇性地同時備份到 S3 儲存貯體。

顯示 OpenSearch 服務的 Amazon 數據 Firehose 數據流的圖表。

以 Splunk 目的地而言,串流資料會交付到 Splunk,然後可以選擇性同時備份到 S3 儲存貯體。

顯示 Splunk 的 Amazon 數據 Firehose 數據流的圖表。