AWS Analytics category icon 分析 - Amazon Web Services 概觀

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

AWS Analytics category icon 分析

AWS 提供符合您所有資料分析需求的全方位分析服務,並可讓各種規模和產業的組織使用資料來重塑其業務。從儲存和管理、資料管控、動作和體驗, AWS 提供專門建置的服務,可提供最佳的價格效能、可擴展性和最低的成本。

每個服務都會在圖表後面描述。為了協助您決定最符合您需求的服務,請參閱選擇 AWS 分析服務。如需一般資訊,請參閱 上的分析 AWS

顯示 AWS 分析服務的圖表

返回 AWS 服務

Amazon Athena

Amazon Athena 是一種互動式查詢服務,可讓您使用標準 SQL 輕鬆分析 Amazon S3 中的資料。Athena 無伺服器,所以不需管理基礎設施,而且您只需支付所執行查詢的費用。

Athena 易於使用。只要指向 Amazon S3 中的資料、定義結構描述,然後使用標準 SQL 開始查詢即可。大多數結果會在幾秒鐘內交付。使用 Athena,不需要複雜的擷取、轉換和載入 (ETL) 任務,即可準備資料以供分析。這可讓具備 SQL 技能的任何人輕鬆快速分析大規模資料集。

Athena 已out-of-the-box AWS Glue Data Catalog可讓您跨各種服務建立統一的中繼資料儲存庫、爬取資料來源以探索結構描述,並使用新的和修改過的資料表和分割區定義填入您的目錄,以及維護結構描述版本控制。

Amazon CloudSearch

Amazon CloudSearch 是 中的受管服務 AWS 雲端 ,可讓您輕鬆且符合成本效益地設定、管理和擴展網站或應用程式的搜尋解決方案。Amazon CloudSearch 支援 34 種語言和熱門搜尋功能,例如反白、自動完成和地理空間搜尋。

Amazon DataZone

Amazon DataZone 是一種資料管理服務,可讓您用來發佈資料,並透過個人化 Web 應用程式將其提供給業務資料目錄。無論資料存放於何處 AWS,或內部部署或 Salesforce 等 SaaS 應用程式,您都可以更安全地存取資料。Amazon DataZone 可簡化您跨 AWS 服務的體驗,例如 Amazon Redshift、Amazon Athena AWS Glue AWS Lake Formation、 和 Amazon QuickSight。

Amazon EMR

Amazon EMR 是業界領先的雲端大數據平台,可使用 Apache SparkApache HiveApache HBaseApache FlinkApache HudiPresto 等開放原始碼工具來處理大量資料。Amazon EMR 透過自動化佈建容量和調校叢集等耗時的任務,讓您輕鬆設定、操作和擴展大數據環境。使用 Amazon EMR,您可以用傳統現場部署解決方案成本的一半,以及比標準 Apache Spark 快 3 倍以上的速度執行 PB 級分析。您可以在 Amazon EC2 執行個體、Amazon Elastic Kubernetes Service (Amazon EKS) 叢集或使用 Amazon EMR on 的內部部署上執行工作負載 AWS Outposts。

Amazon FinSpace

Amazon FinSpace 是一種專為金融服務產業 (FSI) 打造的資料管理和分析服務。FinSpace 會將您尋找和準備 PB 財務資料的時間,從數月縮短為幾分鐘,以準備好進行分析。

金融服務組織會分析來自內部資料存放區的資料,例如產品組合、精算和風險管理系統,以及來自第三方資料饋送的 PB 資料,例如來自股票交換的歷史證券價格。可能需要幾個月的時間才能找到正確的資料、取得以合規方式存取資料的許可,以及準備進行分析。

FinSpace 消除了建置和維護用於財務分析之資料管理系統的繁重負擔。使用 FinSpace,您可以收集資料,並依相關商業概念進行分類,例如資產類別、風險分類或地理區域。FinSpace 可根據您的合規要求,輕鬆探索和跨組織共用資料。您可以在一個位置定義資料存取政策,FinSpace 會強制執行它們,同時保留稽核日誌,以允許合規和活動報告。FinSpace 也包含超過 100 個函數的程式庫,例如時間軸和布林值帶,可讓您準備資料以供分析。

Amazon Kinesis

Amazon Kinesis 可讓您輕鬆地收集、處理和分析即時串流資料,以便及時獲得洞見並快速回應新資訊。Amazon Kinesis 提供關鍵功能,以經濟實惠的方式處理任何規模的串流資料,以及彈性選擇最適合您應用程式需求的工具。使用 Amazon Kinesis,您可以擷取即時資料,例如影片、音訊、應用程式日誌、網站點擊串流,以及適用於機器學習 (ML)、分析和其他應用程式的 IoT 遙測資料。Amazon Kinesis 可讓您在資料送達時處理和分析資料,並立即回應,而不必等到收集所有資料後,才能開始處理。

Amazon Kinesis 目前提供四種服務:Firehose、Managed Service for Apache Flink、Kinesis Data Streams 和 Kinesis Video Streams。

Amazon Data Firehose

Amazon Data Firehose 是可靠地將串流資料載入資料存放區和分析工具的最簡單方法。它可以擷取、轉換串流資料,並將資料載入 Amazon S3、Amazon Redshift、Amazon OpenSearch Service 和 Splunk,透過您目前已經使用的現有商業智慧工具和儀表板,實現近乎即時的分析。它是一種全受管服務,可自動擴展以符合資料的輸送量,而且不需要持續管理。它也可以在載入資料之前批次處理、壓縮、轉換和加密資料,將目的地使用的儲存量降至最低,並提高安全性。

您可以從 輕鬆建立 Firehose 交付串流 AWS Management Console,只需按幾下即可設定,並開始將資料從數十萬個要持續載入的資料來源傳送至串流 AWS,只要幾分鐘的時間。您也可以設定交付串流,在資料交付至 Amazon S3 之前,自動將傳入資料轉換為欄式格式,例如 Apache Parquet 和 Apache ORC,以節省成本。

Amazon Managed Service for Apache Flink

Amazon Managed Service for Apache Flink 是分析串流資料、取得可行洞見以及即時回應業務和客戶需求的最簡單方法。Amazon Managed Service for Apache Flink 可降低建置、管理和整合串流應用程式與其他 AWS 服務的複雜性。SQL 使用者可以輕鬆查詢串流資料,或使用 範本和互動式 SQL 編輯器建置整個串流應用程式。Java 開發人員可以使用開放原始碼 Java 程式庫和 AWS 整合快速建置複雜的串流應用程式,以即時轉換和分析資料。

Amazon Managed Service for Apache Flink 會處理持續執行查詢所需的一切,並自動擴展以符合傳入資料的磁碟區和輸送量速率。

Amazon Kinesis Data Streams

Amazon Kinesis Data Streams 是一項大規模可擴展且耐用的即時資料串流服務。Kinesis Data Streams 可以持續從數十萬個來源擷取每秒 GB 的資料,例如網站點擊串流、資料庫事件串流、金融交易、社交媒體摘要、IT 日誌和位置追蹤事件。收集的資料可在幾毫秒內提供,以啟用即時分析使用案例,例如即時儀表板、即時異常偵測、動態定價等。

Amazon Kinesis Video Streams

Amazon Kinesis Video Streams 可讓您輕鬆地將視訊從連線裝置安全地串流到 , AWS 以進行分析、ML、播放和其他處理。Kinesis Video Streams 會自動佈建並彈性擴展從數百萬部裝置擷取串流影片資料所需的所有基礎設施。它也會持久地將影片資料存放在串流中、加密和編製索引,並可讓您透過easy-to-use存取資料。 APIs Kinesis Video Streams 可讓您播放影片以進行即時和隨需檢視,並透過與 Amazon Rekognition Video 整合,以及適用於 Apache MxNet、TensorFlow 和 OpenCV 等 ML 架構的程式庫,快速建置利用電腦視覺和影片分析的應用程式。

Amazon OpenSearch Service

Amazon OpenSearch Service (OpenSearch Service) 可讓您輕鬆地部署、保護、操作和擴展 OpenSearch,以即時搜尋、分析和視覺化資料。使用 Amazon OpenSearch Service,您可以easy-to-use和即時分析功能,為日誌分析、全文搜尋、應用程式監控和點擊流分析等使用案例提供支援,並具備企業級可用性、可擴展性和安全性。 APIs 此服務提供與開放原始碼工具的整合,例如 OpenSearch Dashboards 和 Logstash,以進行資料擷取和視覺化。它也與其他 AWS 服務無縫整合,例如 Amazon Virtual Private Cloud (Amazon VPC)、 AWS Key Management Service (AWS KMS)、Amazon Data FirehoseAWS Lambda、、 AWS Identity and Access Management (IAM)Amazon CognitoAmazon CloudWatch,因此您可以從原始資料快速取得可採取行動的洞見。

Amazon OpenSearch Serverless

Amazon OpenSearch Serverless 是 Amazon OpenSearch Service 中的無伺服器選項。身為開發人員,您可以使用 OpenSearch Serverless 執行 PB 級工作負載,而無需設定、管理和擴展 OpenSearch 叢集。您獲得與 OpenSearch Service 相同的互動式毫秒回應時間,且具有無伺服器環境的簡單性。

適用於 Amazon OpenSearch Serverless 的向量引擎新增了簡單、可擴展且高效能的向量儲存和搜尋功能,可協助開發人員建置 ML 擴增搜尋體驗和生成式 AI 應用程式,而無需管理向量資料庫基礎設施。向量搜尋集合的使用案例包括影像搜尋、文件搜尋、音樂擷取、產品建議、影片搜尋、以位置為基礎的搜尋、詐騙偵測和異常偵測。

Amazon Redshift

Amazon Redshift 是最廣泛使用的雲端資料倉儲。使用標準 SQL 和現有的商業智慧 (BI) 工具分析所有資料,既快速、簡單又符合成本效益。它可讓您使用複雜的查詢最佳化、高效能儲存上的單欄式儲存,以及大規模平行查詢完成,針對 TB 到 PB 的結構化和半結構化資料執行複雜的分析查詢。大多數結果會在幾秒鐘內回傳。您可以每小時只需 0.25 美元,無需任何承諾,並擴展到 PB 的資料,每年每 1TB 1,000 美元,低於傳統內部部署解決方案成本的十分之一。

Amazon Redshift Serverless

Amazon Redshift Serverless 可讓您更輕鬆地執行和擴展分析,而無需管理您的資料倉儲基礎設施。開發人員、資料科學家和分析師可以跨資料庫、資料倉儲和資料湖工作,以建置報告和儀表板應用程式、執行近乎即時的分析、共用和協作資料,以及建置和訓練機器學習 (ML) 模型。幾秒鐘內即可從大量資料轉換為洞見。Amazon Redshift Serverless 會自動佈建並智慧擴展資料倉儲容量,即使是最嚴苛且無法預測的工作負載也能提供快速效能,而且您只需為使用量付費。只要在 Amazon Redshift 查詢編輯器或您喜愛的商業智慧 (BI) 工具中載入資料並立即開始查詢,就能在easy-to-use零管理環境中繼續享受最佳價格效能和熟悉的 SQL 功能。

Amazon QuickSight

Amazon QuickSight 是一項快速、雲端驅動的商業智慧 (BI) 服務,可讓您輕鬆地為組織中的每個人提供洞見。QuickSight 可讓您建立和發佈可從瀏覽器或行動裝置存取的互動式儀表板。您可以將儀表板內嵌到您的應用程式中,為您的客戶提供強大的自助式分析。Amazon QuickSight 可輕鬆擴展到數萬使用者,而不需要安裝任何軟體、要部署的伺服器或要管理的基礎設施。

AWS Clean Rooms

AWS Clean Rooms 可協助公司及其合作夥伴更輕鬆、安全地分析和協作其集合資料集,而無需共用或複製彼此的基礎資料。使用 AWS Clean Rooms,客戶可以在幾分鐘內建立安全的資料無塵室,並在 上與任何其他公司合作 AWS 雲端 ,以產生有關廣告行銷活動、投資決策和研究和開發的獨特洞見。

AWS Data Exchange

AWS Data Exchange 可讓您在雲端輕鬆尋找、訂閱和使用第三方資料。合格資料提供者包括類別領導品牌,例如 路透、 每年以多種語言整理來自超過 220 萬個獨特新聞案例的資料; 變更醫療保健、 每年處理和匿名處理超過 140 億筆醫療保健交易和 1 兆美元的理賠; Dun & Bradstreet, 維護超過 3.3 億筆全球商業記錄的資料庫; 和 Foursquare 其位置資料衍生自 2.2 億個唯一消費者,並包含超過 6,000 萬個全球商業場所。

訂閱資料產品後,您可以使用 AWS Data Exchange API 直接將資料載入 Amazon S3,然後使用各種 AWS 分析ML 服務進行分析。例如, 屬性保險業者可以訂閱資料,以分析歷史天氣模式,以校正不同地理位置的保險範圍要求; 餐廳可以訂閱人口和位置資料,以識別擴展的最佳區域; 學術研究人員可以透過訂閱二氧化碳排放量的資料,對氣候變遷進行研究; 和 醫療專業人員可以訂閱歷史臨床試驗的彙總資料,以加速其研究活動。

對於資料提供者, AWS Data Exchange 可讓您輕鬆到達數百萬 AWS 客戶遷移至雲端,無需建置和維護資料儲存、交付、計費和授權的基礎設施。

AWS Data Pipeline

AWS Data Pipeline 是一種 Web 服務,可協助您在指定的間隔內可靠地處理和移動不同 AWS 運算和儲存服務之間的資料,以及內部部署資料來源。使用 AWS Data Pipeline,您可以定期存取儲存資料的位置、大規模轉換和處理資料,並將結果有效率地傳輸至 Amazon S3Amazon RDSAmazon DynamoDBAmazon EMR 等 AWS 服務。

AWS Data Pipeline 可協助您輕鬆建立可容錯、可重複且高可用性的複雜資料處理工作負載。您不需要擔心確保資源可用性、管理任務間相依性、在個別任務中重試暫時性故障或逾時,或建立故障通知系統。 AWS Data Pipeline 也可讓您移動和處理先前鎖定在內部部署資料孤島中的資料。

AWS 實體解析

AWS 實體解析是一項服務,可協助您比對和連結跨多個應用程式、管道和資料存放區存放的相關記錄,而無需建置自訂解決方案。 AWS 實體解決方案使用靈活、可設定的 ML 和規則型技術,可以移除重複的記錄、透過連接不同的客戶互動來建立客戶設定檔,以及個人化廣告和行銷活動、忠誠度計劃和電子商務的體驗。例如,您可以將廣告點選、購物車放棄和購買等近期事件連結至唯一的配對 ID,以建立客戶互動的統一檢視。

AWS Glue

AWS Glue 是一項全受管擷取、轉換和載入 (ETL) 服務,可讓客戶輕鬆準備和載入資料以供分析。您可以在 中建立並執行 ETL 任務,只需按幾下滑鼠 AWS Management Console。您只需 AWS Glue 指向存放在 中的資料 AWS,並 AWS Glue 探索您的資料,並將相關聯的中繼資料 (例如資料表定義和結構描述) 存放在 中 AWS Glue Data Catalog。編製目錄後,您的資料即可立即搜尋、查詢,並可供 ETL 使用。

AWS Glue 資料整合引擎提供使用 Apache Spark、PySpark 和 Python 的資料存取權。加入 AWS Glue for Ray 後,您可以使用 Ray 進一步擴展工作負載,這是開放原始碼的統一運算架構。

AWS Glue Data Quality 可以測量和監控 Amazon S3 型資料湖、資料倉儲和其他資料儲存庫的資料品質。它會自動運算統計資料、建議品質規則,並在偵測到遺失、過時或錯誤資料時,監控並提醒您。您可以在 和 AWS Glue Data Catalog ETL 任務 AWS Glue Data Catalog 中存取它。

AWS Lake Formation

AWS Lake Formation 是一項服務,可讓您在幾天內輕鬆設定安全的資料湖。資料湖是一個集中式、經策管且安全的儲存庫,可用原始格式存放您的所有資料並準備進行分析。資料湖可讓您細分資料孤島,再結合不同類型的分析來取得洞察並指導得出更佳的商業決策。

不過,今天設定和管理資料湖需要許多手動、複雜且耗時的作業。此工作包括從不同來源載入資料、監控這些資料流程、設定分割區、開啟加密和管理金鑰、定義轉換任務並監控其操作、將資料重新組織成單欄式格式、設定存取控制設定、刪除重複資料、比對連結記錄、授予資料集的存取權,以及稽核一段時間內的存取權。

使用 Lake Formation 建立資料湖就像定義資料所在位置,以及您想要套用的資料存取和安全政策一樣簡單。Lake Formation 接著會從資料庫和物件儲存收集和分類資料、將資料移至新的 Amazon S3 資料湖、使用 ML 演算法清理和分類資料,以及保護對敏感資料的存取。然後,您的使用者可以存取集中式的資料集目錄,其中描述可用的資料集及其適當的用量。然後,您的使用者會利用這些資料集搭配其分析和 ML 服務選擇,例如 Amazon EMR for Apache Spark、Amazon Redshift、Amazon Athena、SageMaker AI 和 Amazon QuickSight。

Amazon Managed Streaming for Apache Kafka (Amazon MSK)

Amazon Managed Streaming for Apache Kafka (Amazon MSK) 是一項全受管服務,可讓您輕鬆建置和執行使用 Apache Kafka 處理串流資料的應用程式。Apache Kafka 是用於建置即時串流資料管道和應用程式的開放原始碼平台。透過 Amazon MSK,您可以使用 Apache Kafka APIs 填入資料湖、在資料庫之間串流變更,以及支援 ML 和分析應用程式。

Apache Kafka 叢集難以在生產環境中設定、擴展和管理。當您自行執行 Apache Kafka 時,您需要佈建伺服器、手動設定 Apache Kafka、在伺服器失敗時取代伺服器、協調伺服器修補程式和升級、架構叢集以獲得高可用性、確保資料長期存放和安全、設定監控和警示,以及仔細規劃擴展事件以支援負載變更。Amazon MSK 可讓您輕鬆地在 Apache Kafka 上建置和執行生產應用程式,而不需要 Apache Kafka 基礎設施管理專業知識。這表示您花較少的時間管理基礎設施,而花更多時間建置應用程式。

只要在 Amazon MSK 主控台中按一下幾下,您就可以根據 Apache Kafka 的部署最佳實務,使用設定和組態來建立高可用性的 Apache Kafka 叢集。Amazon MSK 會自動佈建並執行您的 Apache Kafka 叢集。Amazon MSK 會持續監控叢集運作狀態,並自動取代運作狀態不佳的節點,而不會讓應用程式停機。此外,Amazon MSK 透過加密靜態資料來保護您的 Apache Kafka 叢集。

返回 AWS 服務